본문으로 건너뛰기

2024-10-11

2달러 H100s: GPU 대여 거품이 어떻게 터졌는가

  • GPU 시장은 공급 과잉과 수요 변화 역학으로 인해 H100 GPU의 가격이 시간당 $8에서 $2 이하로 크게 하락했습니다. 이러한 변화에 기여하는 요인으로는 예약된 컴퓨팅 재판매, 오픈 모델 미세 조정, 새로운 기초 모델 회사의 감소가 있으며, 이는 GPU를 구매하는 것보다 임대하는 것이 더 유리하게 만들고 있습니다. AMD 및 Intel GPU와 같은 더 저렴한 대안과 오픈 웨이트 모델의 출현이 시장에 영향을 미치고 있으며, Featherless.AI와 같은 플랫폼이 비용 효율적인 AI 솔루션을 제공함에 따라 AI 추론 및 미세 조정에 대한 강조가 커지고 있습니다.

반응

  • GPU 대여 시장에서 H100 GPU의 가격이 시간당 $8에서 $2로 급격히 하락했습니다. 이는 공급 과잉과 새로운 기반 모델 회사들의 수요 감소 때문입니다.
  • 이 가격 인하로 인해 GPU 대여 거품이 터지면서 GPU 인프라에 대규모 투자를 한 투자자들에게 영향을 미쳤습니다.
  • 이 기사는 더 저렴한 컴퓨팅 옵션으로 더 접근 가능한 AI 환경의 가능성을 탐구하지만, 이러한 낮은 가격의 장기적인 지속 가능성과 AI 인프라의 미래는 불확실하다고 설명합니다.

테슬라 로보택시

반응

  • 최근 테슬라는 로보택시를 선보이며, 고가의 하드웨어인 LiDAR를 사용하는 웨이모의 접근 방식과 대조되는 자율 택시에 대한 비전을 강조했습니다. 운전대가 없는 로보택시의 디자인은 완전한 자율성에 의존하는 미래를 나타내지만, 이는 규제 및 기술적 도전에 직면해 있습니다. 테슬라의 완전 자율 주행(FSD) 기술은 논쟁의 주제로, 비판자들은 무감독 주행에 대한 준비 상태를 의문시하는 반면, 지지자들은 그 잠재력에 대해 낙관적입니다.

Chrome 안정 버전에서 여전히 Manifest V2를 사용하는 설치된 확장 프로그램 비활성화 시작

  • Google은 2024년 10월 9일부터 사전 안정 채널에서 이러한 확장 프로그램에 대한 경고 및 비활성화를 시작으로 Chrome 확장 프로그램에 대한 Manifest V2를 단계적으로 폐지하고 있습니다.
  • 사용자들은 Manifest V3 대안으로 전환할 것이 권장되며, 기업들은 ExtensionManifestV2Availability 정책을 사용하여 2025년 6월까지 전환을 완료해야 합니다.
  • 단계적 폐지 과정은 2024년 6월 3일에 시작되었으며, Chrome 웹 스토어는 2022년 6월부터 비공개용 Manifest V2 확장 프로그램을, 2022년 1월부터 공개 또는 목록에 없는 확장 프로그램을 더 이상 수락하지 않았습니다.

반응

  • Chrome은 광고 차단기인 uBlock Origin과 같은 확장 프로그램의 기능을 제한하면서 Manifest V2에서 Manifest V3 확장 프로그램으로 전환하고 있습니다. Chrome이 이러한 변화를 진행하는 동안 Firefox, Vivaldi, Brave와 같은 브라우저는 당분간 Manifest V2를 계속 지원할 계획입니다. 이 변화는 사용자 제어와 프라이버시에 대한 논의를 촉발했으며, 일부 사용자는 효과적인 광고 차단 기능을 유지하기 위해 대체 브라우저로 전환하는 것을 고려하고 있습니다.

리습으로 작성된 RISC-V용 리습 컴파일러

  • uLisp는 마이크로컨트롤러를 위해 설계된 Lisp 프로그래밍 언어의 버전으로, Arduino, Raspberry Pi, ESP32와 같은 플랫폼을 지원합니다. 디버깅, SD 카드 인터페이스, I2C/SPI 직렬 인터페이스와 같은 기능을 포함하며, LED 깜박임 및 데이터 로깅과 같은 응용 프로그램에 대한 예제를 제공합니다. 중요한 기능 중 하나는 RISC-V를 위한 Lisp 컴파일러로, Lisp 함수를 기계어 코드로 컴파일하며, 성능 향상을 위해 재귀 함수와 꼬리 호출 최적화를 지원합니다.

반응

  • Lisp로 작성된 RISC-V용 Lisp 컴파일러가 개발 중에 있지만, 자체 컴파일을 위한 특정 연산과 기능이 부족합니다. 이 컴파일러는 car와 cdr 같은 기본적인 Lisp 기능을 지원하지만 아직 완성되지 않았습니다. uLisp는 그 단순함과 마이크로컨트롤러에 적합하다는 점에서 주목받고 있으며, RISC-V는 기술 애호가와 해커들에게 매력적인 플랫폼입니다.

2024년 노벨 평화상, 일본 히단쿄에 수여

  • 2024년 노벨 평화상은 핵무기 없는 세상을 위한 옹호 활동으로 일본의 원자폭탄 생존자 단체인 일본 피폭자 협회(히바쿠샤)에게 수여되었습니다. 히바쿠샤는 그들의 영향력 있는 증언을 통해 핵무기 사용에 반대하는 세계적 규범인 '핵 금기'를 확립하는 데 크게 기여했습니다. 이 수상은 인류에 이바지하는 노력을 기리려는 알프레드 노벨의 비전에 부합하며, 핵 군축을 향한 새로운 세대에게 계속해서 영감을 줍니다.

반응

  • 2024년 노벨 평화상은 일본의 핵무기 반대 단체인 일본 피폭자 협회(니혼 히단쿄)에 수여되었으며, 이는 전 세계적인 긴장 속에서 핵무기의 지속적인 위협을 강조합니다. 이 상은 히로시마와 나가사키로 대표되는 핵전쟁의 파괴적인 영향을 상기시키며, 군축의 중요성을 강조합니다. 또한, 이 상의 논의는 핵 억제, 국제법, 핵 보유국 간의 지정학적 역학의 복잡성을 포함합니다.

WordPress 대안

  • 이 기사는 특히 현재의 워드프레스 상황을 고려하여 증가된 관심으로 인해 더 많은 콘텐츠 관리 시스템(CMS) 대안을 포함하도록 업데이트되었습니다. 이 목록에는 Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail, Textpattern과 같은 다운로드 가능한 CMS 옵션이 포함되어 있으며, API 및 git 기반 CMS는 제외되었습니다. 주목할 만한 언급으로는 내장 이메일 기능을 갖춘 Ghost, 파일 기반 접근 방식을 사용하는 Kirby, 커뮤니티 주도의 워드프레스 포크인 ClassicPress가 있으며, Anchor와 같은 일부 CMS는 더 이상 유지 관리되지 않습니다.

반응

  • GitHub Pages의 Jekyll은 Markdown을 사용하는 간단한 블로그에 권장되며, 로컬 설정이 필요 없이 사용이 용이하고 플랫폼 간 콘텐츠 이동성을 제공합니다.
  • 블로깅을 위한 WordPress의 대안으로는 Chyrp Lite, Typecho, Quartz, Logseq가 있으며, Drupal, ProcessWire, Wagtail은 개발자에게 더 많은 유연성을 제공합니다.
  • Astro와 Publii와 같은 정적 사이트 생성기가 점점 인기를 얻고 있으며, 이미지 호스팅을 위해 S3+Cloudfront 또는 CloudFlare와 같은 옵션이 제안되고 있습니다.

Google Play가 내 게임을 삭제했는데 이유를 알려주지 않아요

  • 인디 게임 개발자 Tukkun은 "Anti-Idle: Reborn"이라는 게임을 개발해 왔으며, 이 게임은 Google과 Apple의 승인을 받아 한 달간 클로즈드 베타 테스트를 진행했습니다. 2024년 10월 7일, Google은 "이전 위반"과 "고위험 행동"을 이유로 Tukkun의 계정을 해지했으나 명확한 설명을 제공하지 않아 그의 작업과 수입에 영향을 미쳤습니다. 이 상황은 개발자들이 모호한 계정 해지를 경험하는 더 넓은 문제를 부각시키며, Google과 같은 플랫폼으로부터 더 많은 투명성과 명확성을 요구하는 목소리를 불러일으키고 있습니다.

반응

  • 구글 플레이는 개발자의 게임을 설명 없이 삭제하여 기술 회사들이 개발자들에 대해 갖고 있는 상당한 통제력을 강조했다.
  • 유사한 사건들이 아마존과 구글에서도 보고되었으며, 계정이나 앱이 명확한 이유나 적절한 지원 없이 차단되는 경우가 있습니다.
  • 개발자들은 플랫폼을 다양화하여 위험을 완화하도록 권장되며, 이 상황은 기술 대기업의 고객 서비스와 그들의 플랫폼에 비즈니스를 구축하는 것에 대한 의존 위험에 대한 더 넓은 우려를 강조합니다.

Nurdle Patrol

반응

  • 2023년에 221개의 해상 운송 컨테이너가 바다에 유실되었는데, 이는 매년 2억 5천만 개가 운송되는 것에 비해 적은 수치로, 글로벌 해상 운송 작업의 규모를 보여줍니다.
  • 플라스틱 펠릿, 즉 너들(nurdles)은 해변에서 눈에 띄는 오염 물질이며 미세플라스틱으로 분해되어 식품 사슬에 들어가 잠재적인 해를 끼칠 수 있지만, 해양 플라스틱 오염의 주요 원인은 아닙니다.
  • 플라스틱 오염에 대한 논의는 그 복잡성과 전 세계적인 영향을 강조하며, 선진국에서 개발도상국으로의 폐기물 수출 문제와 플라스틱 오염에 대한 생태계의 잠재적 적응을 포함하여 미래의 플라스틱 사용에 대한 우려를 제기하고 있습니다.

초기 CUDA 성능 교훈

  • Malte Skarupke는 CUDA를 배우면서 겪은 경험에 대해 이야기하며, CUDA가 본질적으로 병렬 컴퓨팅을 위한 추가 기능이 있는 C++라고 언급합니다.
  • CUDA 성능 최적화를 위한 주요 교훈에는 메모리 병합, 다양한 메모리 유형 이해, 많은 스레드를 사용하여 병렬성을 극대화하고 작업을 다른 커널로 분리하는 것이 포함됩니다.
  • 스카룹케는 CUDA 작성이 퍼즐을 푸는 것과 유사하다고 강조하며, 속도를 최적화하기 전에 병렬로 작업을 실행하는 데 주된 초점을 맞춰야 한다고 말합니다.

반응

  • 논의는 LHC(대형 강입자 충돌기) 실험 트리거를 위한 GPU 성능 최적화를 위해 CUDA 코드를 최적화하는 데 중점을 두고 있으며, 여기에는 레지스터, 공유 메모리 및 스레드 블록 관리가 포함됩니다.
  • 이는 CUDA에서 프로그래밍 제약의 진화를 강조하면서 점유율(활성 스레드의 수), 레지스터 사용 및 메모리 지연 시간 간의 균형을 강조합니다.
  • 대화는 GPU와 CPU의 성능을 비교하며 전력 소비와 계산 능력의 차이를 언급하고, 향후 하드웨어 및 소프트웨어 발전을 위해 점유율과 성능의 균형을 맞추는 것의 중요성을 강조합니다.

FBI는 암호화폐 펌프 앤 덤프 사기를 조사하기 위해 코인을 만들었습니다.

  • FBI는 암호화폐 펌프 앤 덤프 사기를 조사하고 폭로하기 위해 이더리움 기반 암호화폐인 NexFundAI를 개발하여 중요한 법적 조치를 이끌어냈습니다. - 18명의 개인과 단체가 사기 및 시장 조작 혐의로 기소되었으며, 증권거래위원회는 암호화 자산 가격을 부풀린 세 명의 시장 조성자와 아홉 명의 다른 사람들을 대상으로 했습니다. - 법무부는 2,500만 달러의 사기 수익을 성공적으로 회수하여 투자자들에게 반환할 예정이며, 이는 암호화폐 사기에 맞서 싸우는 작전의 효과를 강조합니다.

반응

  • FBI는 암호화폐를 개발하여 펌프 앤 덤프 사기 수법을 조사했습니다. 이는 자산의 가격을 인위적으로 부풀린 후 매도하는 사기 행위입니다.
  • 이 이니셔티브는 함정 수사와 법 집행 기관이 위조 증권을 만드는 것의 윤리적 함의에 대한 논쟁을 촉발했습니다.
  • 논의는 암호화폐의 정당성에 대한 더 넓은 우려와 디지털 화폐를 규제하는 데 있어 정부의 역할로 확장됩니다.

NotesHub: 크로스 플랫폼, 마크다운 기반 노트 작성 앱

  • 이 앱은 iOS, Android, Windows, Mac, Apple Vision Pro 및 웹을 포함한 여러 플랫폼에서 사용할 수 있으며, 웹 버전은 오프라인에서도 작동하는 무료 프로그레시브 웹 앱입니다. - 노트는 Git 저장소에 저장할 수 있으며, GitHub과의 최상의 통합을 제공하며, Gitea, 파일 시스템 또는 iCloud Drive와 같은 자체 호스팅 옵션도 지원합니다. - 이 앱은 Kanban 보드 생성, Excalidraw 기반 화이트보드 및 Mermaid와 ABC 음악 표기법과 같은 기능을 포함한 확장 기능이 있는 풍부한 Markdown 구문을 지원합니다.

반응

  • NotesHub은 iOS, Android, Windows, Mac, Apple Vision Pro 및 웹을 포함한 여러 플랫폼에서 사용할 수 있는 다재다능한 마크다운 기반 노트 작성 앱입니다. 이 앱은 무료 프로그레시브 웹 앱 버전을 제공하며, 네이티브 버전은 일회성 결제가 필요하고 GitHub, GitLab 또는 Bitbucket과 같은 Git 저장소에 노트를 저장하기 위한 강력한 통합 기능을 제공합니다. 이 앱은 풍부한 마크다운 구문, 칸반 보드 및 Excalidraw 기반 화이트보드를 특징으로 하며, 사용자들은 깔끔한 디자인과 오프라인 기능을 칭찬하지만 오픈 소스가 아니며 리눅스 지원이 제한적입니다.

귀하의 인프라에 의존하지 않는 데드맨 스위치

  • 새로운 Go 프로젝트인 Deadcheck가 개발되어 cron 작업, 타이머 또는 데이터베이스에 의존하지 않고 데드맨 스위치로 기능합니다. Deadcheck는 인기 있는 인시던트 관리 플랫폼인 PagerDuty와 통합되어 체크인이 누락될 때까지 인시던트를 일시 중지 상태로 유지하다가 경고를 트리거합니다. 이 프로젝트는 전통적인 일정 관리나 데이터베이스 의존성 없이 경고 및 인시던트를 관리하는 혁신적인 접근 방식으로 주목할 만합니다.

반응

  • Deadcheck은 cron 작업이나 데이터베이스가 필요 없는 데드맨 스위치로 설계된 Go 프로젝트로, 경고 관리를 위해 PagerDuty와 통합됩니다.
  • 이 프로젝트는 변호사나 블록체인 시스템을 사용하는 것과 같은 법적 측면 및 대안 솔루션을 포함하여 데드맨 스위치에 대한 논의를 촉발했습니다.
  • 사용자들은 유사한 기능을 위해 Cronitor나 OpsGenie와 같은 기존 서비스를 제안했으며, 프로젝트는 PagerDuty를 넘어 통합을 확장할 계획입니다.

대형 언어 모델에서 수학적 추론의 한계를 이해하기

  • Iman Mirzadeh 등 저자의 논문 "GSM-Symbolic"은 GSM8K 벤치마크를 사용하여 대형 언어 모델(LLM)의 수학적 추론 능력을 조사합니다. 저자들은 상징적 템플릿을 가진 새로운 벤치마크인 GSM-Symbolic을 소개하며, LLM이 질문에서 숫자 값의 변동과 추가 절에 어려움을 겪는다는 것을 보여줍니다. 이 연구는 LLM이 진정한 논리적 추론을 수행하기보다는 훈련 데이터에서 추론을 복제할 수 있음을 시사하며, 수학적 추론에서의 한계를 강조합니다.

반응

  • 대형 언어 모델(LLM)은 수학적 추론에서 어려움을 겪고 있으며, 특히 문제에 관련 없는 정보가 포함될 때 성능에 영향을 미칩니다. 이 제한은 LLM이 논리적 추론보다 패턴 인식에 의존하고 있음을 강조하며, 불필요한 세부 사항이 있는 실제 시나리오에서 덜 효과적이게 만듭니다. 발전에도 불구하고, LLM은 여전히 중요한 정보와 잡음을 구별하는 데 어려움을 겪고 있으며, 이는 실용적인 응용을 위해 필요한 중요한 기술입니다.

ARIA: 개방형 다중 모달 네이티브 전문가 혼합 모델

  • Aria는 다양한 실제 정보를 통합하여 포괄적인 이해를 제공하는 개방형 멀티모달 네이티브 AI 모델로, 성능 면에서 Pixtral-12B 및 Llama3.2-11B와 같은 모델을 능가합니다. 이 모델은 시각 및 텍스트 토큰당 각각 39억 및 35억 개의 활성화된 매개변수를 가진 전문가 혼합 모델로, 언어 및 멀티모달 기능을 향상시킵니다. 모델의 가중치와 코드베이스는 오픈 소스로 제공되어 개발자와 연구자들이 쉽게 채택하고 적응할 수 있습니다.

반응

  • ARIA는 새로운 멀티모달 네이티브 전문가 혼합(MoE) 모델로, 활성 파라미터를 효율적으로 활용하여 Pixtral-12B와 Llama3.2-11B를 성능과 추론 속도에서 능가합니다. - 25B 모델과 유사한 메모리 사용량을 가지면서도 ARIA는 10B 모델처럼 성능을 발휘하고 4B 모델처럼 빠르게 작동하여 M2 Max와 같은 적절한 메모리를 가진 장치에 적합합니다. - 이 모델의 전문가들은 구문에 중점을 두고 있으며, 전문가 선택에서 개선의 여지가 있으며, 현재 테스트가 가능하지만 일부 사용자는 플랫폼 문제를 겪고 있습니다.