Skip to main content

2024-10-11

2 H100s: Bagaimana Gelembung Penyewaan GPU Meletus

  • The pasar GPU telah mengalami penurunan harga yang signifikan, dengan GPU H100 turun dari $8/jam menjadi di bawah $2/jam karena kelebihan pasokan dan perubahan dinamika permintaan. Faktor-faktor yang berkontribusi terhadap pergeseran ini termasuk penjualan kembali komputasi yang dipesan, penyesuaian model terbuka, dan pengurangan perusahaan model dasar baru, membuat menyewa GPU lebih menguntungkan daripada membeli. Munculnya model berbobot terbuka dan alternatif yang lebih terjangkau, seperti GPU AMD dan Intel, mempengaruhi pasar, dengan penekanan yang semakin besar pada inferensi AI dan penyesuaian, didukung oleh platform seperti Featherless.AI yang menawarkan solusi AI yang hemat biaya.

Reaksi

  • The GPU rental market telah mengalami penurunan harga yang dramatis untuk GPU H100, dari $8/jam menjadi $2/jam, karena kelebihan pasokan dan penurunan permintaan dari perusahaan model dasar baru.
  • Penurunan harga ini telah meletuskan gelembung penyewaan GPU, mempengaruhi investor yang banyak berinvestasi dalam infrastruktur GPU.
  • Tulisan tersebut mengeksplorasi potensi untuk lanskap AI yang lebih mudah diakses dengan opsi komputasi yang lebih murah, meskipun keberlanjutan jangka panjang dari harga rendah ini dan masa depan infrastruktur AI masih belum pasti.

Tesla Robotaxi

Reaksi

  • Baru-baru ini, Tesla memamerkan Robotaxi-nya, menekankan visi untuk taksi otonom yang berbeda dengan pendekatan Waymo, yang menggunakan perangkat keras mahal seperti LiDAR. Desain Robotaxi, yang tidak memiliki setir, menunjukkan masa depan yang bergantung pada otonomi penuh, meskipun menghadapi tantangan regulasi dan teknologi. Teknologi Full Self-Driving (FSD) Tesla menjadi topik perdebatan, dengan para kritikus mempertanyakan kesiapan untuk mengemudi tanpa pengawasan dan para pendukung optimis tentang potensinya.

Mulai menonaktifkan ekstensi yang terpasang yang masih menggunakan Manifest V2 di Chrome stabil

  • Google secara bertahap menghapus Manifest V2 untuk ekstensi Chrome, dengan peringatan dan penonaktifan ekstensi ini dimulai pada saluran pra-stabil mulai 9 Oktober 2024.
  • Pengguna didorong untuk beralih ke alternatif Manifest V3, dengan perusahaan memiliki waktu hingga Juni 2025 untuk menyelesaikan transisi menggunakan kebijakan ExtensionManifestV2Availability.
  • Tahap penghapusan dimulai pada 3 Juni 2024, dan Chrome Web Store tidak menerima ekstensi Manifest V2 baru sejak Juni 2022 untuk ekstensi pribadi dan Januari 2022 untuk ekstensi publik atau yang tidak terdaftar.

Reaksi

  • Chrome sedang beralih dari ekstensi Manifest V2 ke Manifest V3, yang mempengaruhi pemblokir iklan seperti uBlock Origin dengan membatasi kemampuannya. Sementara Chrome melakukan perubahan ini, peramban seperti Firefox, Vivaldi, dan Brave berniat untuk terus mendukung Manifest V2 untuk sementara waktu. Perubahan ini telah memicu diskusi tentang kontrol pengguna dan privasi, dengan beberapa pengguna mempertimbangkan untuk beralih ke peramban alternatif untuk mempertahankan fitur pemblokiran iklan yang efektif.

Sebuah kompilator Lisp ke RISC-V yang ditulis dalam Lisp

  • uLisp adalah versi bahasa pemrograman Lisp yang dirancang untuk mikrokontroler, mendukung platform seperti Arduino, Raspberry Pi, dan ESP32. Ini mencakup fitur-fitur seperti debugging, antarmuka kartu SD, dan antarmuka serial I2C/SPI, dengan contoh aplikasi seperti kedipan LED dan pencatatan data. Fitur pentingnya adalah kompiler Lisp untuk RISC-V, yang mengkompilasi fungsi Lisp menjadi kode mesin, mendukung fungsi rekursif dan optimisasi tail-call untuk meningkatkan kinerja.

Reaksi

  • Sebuah kompilator Lisp untuk RISC-V, yang ditulis dalam Lisp, sedang dalam pengembangan tetapi masih kekurangan operasi dan fungsi tertentu untuk dapat mengompilasi dirinya sendiri. Kompilator ini mendukung fungsi dasar Lisp seperti car dan cdr, tetapi belum lengkap. uLisp disorot karena kesederhanaannya dan kesesuaiannya untuk mikrokontroler, dengan RISC-V menjadi platform yang menarik bagi penggemar teknologi dan peretas.

Nobel Perdamaian 2024 diberikan kepada Nihon Hidankyo

  • Tahun 2024, Hadiah Nobel Perdamaian telah diberikan kepada Nihon Hidankyo, sebuah organisasi Jepang yang terdiri dari para penyintas bom atom, yang dikenal sebagai Hibakusha, atas advokasi mereka untuk dunia bebas nuklir. Hibakusha telah memberikan kontribusi signifikan dalam membangun "tabu nuklir," sebuah norma global yang menentang penggunaan senjata nuklir, melalui kesaksian mereka yang berdampak. Pengakuan ini sejalan dengan visi Alfred Nobel untuk menghormati upaya yang bermanfaat bagi kemanusiaan dan terus menginspirasi generasi baru menuju pelucutan senjata nuklir.

Reaksi

  • Tahun 2024, Hadiah Nobel Perdamaian diberikan kepada Nihon Hidankyo, sebuah organisasi Jepang yang mengadvokasi penentangan terhadap senjata nuklir, menyoroti ancaman persisten dari senjata nuklir di tengah ketegangan global. Penghargaan ini berfungsi sebagai pengingat akan dampak menghancurkan dari perang nuklir, seperti yang dicontohkan oleh Hiroshima dan Nagasaki, dan menekankan pentingnya perlucutan senjata. Diskusi tentang penghargaan ini juga melibatkan kompleksitas pencegahan nuklir, hukum internasional, dan dinamika geopolitik di antara kekuatan nuklir.

Alternatif WordPress

  • Teks artikel telah diperbarui untuk menyertakan lebih banyak alternatif Sistem Manajemen Konten (CMS) karena meningkatnya minat, terutama terkait situasi WordPress saat ini. Daftar tersebut menampilkan opsi CMS yang dapat diunduh seperti Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail, dan Textpattern, dengan pengecualian CMS berbasis API dan git. Sebutan penting termasuk Ghost untuk fitur email bawaan, Kirby untuk pendekatan berbasis file, dan ClassicPress sebagai cabang WordPress yang dipimpin komunitas, sementara beberapa CMS seperti Anchor tidak lagi dipelihara.

Reaksi

  • Jekyll di GitHub Pages direkomendasikan untuk blog sederhana yang menggunakan Markdown, menawarkan kemudahan penggunaan tanpa memerlukan pengaturan lokal dan memungkinkan portabilitas konten di berbagai platform.
  • Alternatif untuk WordPress dalam blogging meliputi Chyrp Lite, Typecho, Quartz, dan Logseq, sementara Drupal, ProcessWire, dan Wagtail memberikan lebih banyak fleksibilitas bagi pengembang.
  • Generator situs statis seperti Astro dan Publii semakin populer, dan untuk hosting gambar, opsi seperti S3+Cloudfront atau CloudFlare disarankan.

Google Play menghapus game saya dan tidak memberi tahu saya alasannya

  • Tukkun, seorang pengembang game indie, telah mengerjakan "Anti-Idle: Reborn," yang telah disetujui oleh Google dan Apple, dan telah berada dalam Beta Tertutup selama sebulan. Pada 7 Oktober 2024, Google menghentikan akun Tukkun dengan alasan "pelanggaran sebelumnya" dan "Perilaku Berisiko Tinggi," tetapi tidak memberikan penjelasan yang jelas, yang mempengaruhi pekerjaannya dan pendapatannya. Situasi ini menyoroti masalah yang lebih luas di mana para pengembang mengalami penghentian akun yang tidak jelas, mendorong seruan untuk lebih banyak transparansi dan kejelasan dari platform seperti Google.

Reaksi

  • Google Play menghapus permainan seorang pengembang tanpa penjelasan, menyoroti kendali signifikan yang dimiliki perusahaan teknologi atas para pengembang.
  • Insiden serupa telah dilaporkan dengan Amazon dan Google, di mana akun atau aplikasi dilarang tanpa alasan yang jelas atau dukungan yang memadai.
  • Pengembang didorong untuk mendiversifikasi platform mereka guna mengurangi risiko, karena situasi ini menyoroti kekhawatiran yang lebih luas tentang layanan pelanggan raksasa teknologi dan risiko ketergantungan dalam membangun bisnis di platform mereka.

Nurdle Patrol

Reaksi

  • Dalam tahun 2023, sebanyak 221 kontainer pengiriman hilang di laut, jumlah yang kecil dibandingkan dengan 250 juta yang dikirim setiap tahun, menyoroti skala operasi pengiriman global.
  • Pelet plastik, yang dikenal sebagai nurdle, adalah polutan yang terlihat di pantai dan dapat terurai menjadi mikroplastik, masuk ke dalam rantai makanan dan berpotensi membahayakan, meskipun mereka bukan sumber utama polusi plastik laut.
  • Teks diskusi tentang polusi plastik menekankan kompleksitas dan dampak globalnya, termasuk masalah ekspor limbah dari negara maju ke negara berkembang dan potensi adaptasi ekosistem terhadap polusi plastik, yang menimbulkan kekhawatiran tentang penggunaan plastik di masa depan.

Pelajaran Awal Kinerja CUDA

  • Malte Skarupke membahas pengalamannya belajar CUDA, mencatat bahwa pada dasarnya itu adalah C++ dengan fitur tambahan untuk komputasi paralel.
  • Pelajaran penting untuk mengoptimalkan kinerja CUDA meliputi penggabungan memori, pemahaman berbagai jenis memori, dan memaksimalkan paralelisme dengan menggunakan banyak thread serta memisahkan tugas ke dalam kernel yang berbeda.
  • Skarupke menekankan bahwa menulis CUDA mirip dengan memecahkan teka-teki, di mana fokus utama harus pada menjalankan tugas secara paralel sebelum mengoptimalkan untuk kecepatan.

Reaksi

  • Teks ini membahas tentang mengoptimalkan kode CUDA untuk kinerja GPU, khususnya untuk pemicu eksperimen LHC (Large Hadron Collider), dengan mengelola register, memori bersama, dan blok thread.
  • Ini menekankan pertukaran antara okupansi (jumlah thread aktif), penggunaan register, dan latensi memori, menyoroti evolusi batasan pemrograman dalam CUDA.
  • Percakapan tersebut membandingkan kinerja GPU dan CPU, mencatat perbedaan dalam konsumsi daya dan kemampuan komputasi, serta menekankan pentingnya menyeimbangkan okupansi dan kinerja untuk kemajuan perangkat keras dan perangkat lunak di masa depan.

FBI menciptakan koin untuk menyelidiki skema pompa-dan-buang kripto

  • The FBI mengembangkan mata uang kripto berbasis Ethereum, NexFundAI, untuk menyelidiki dan mengungkap skema pump-and-dump kripto, yang mengarah pada tindakan hukum yang signifikan. Tuduhan diajukan terhadap 18 individu dan entitas atas penipuan dan manipulasi pasar, dengan Komisi Sekuritas dan Bursa menargetkan tiga pembuat pasar dan sembilan lainnya karena menaikkan harga aset kripto. Departemen Kehakiman berhasil memulihkan $25 juta dari hasil penipuan, yang akan dikembalikan kepada investor, menyoroti efektivitas operasi dalam memerangi penipuan kripto.

Reaksi

  • Teks: FBI mengembangkan mata uang kripto untuk menyelidiki skema pump-and-dump, yang merupakan praktik penipuan yang secara artifisial meningkatkan harga suatu aset sebelum menjualnya.
  • Inisiatif ini telah memicu perdebatan tentang jebakan dan implikasi etis dari penegakan hukum yang menciptakan sekuritas palsu.
  • Diskusi meluas ke kekhawatiran yang lebih luas tentang legitimasi mata uang kripto dan peran pemerintah dalam mengatur mata uang digital.

NotesHub: aplikasi pencatatan lintas platform berbasis Markdown

  • Tersedia di berbagai platform, termasuk iOS, Android, Windows, Mac, Apple Vision Pro, dan Web, aplikasi ini memiliki versi Web yang merupakan Progressive Web App gratis yang dapat berfungsi secara offline. Catatan dapat disimpan dalam repositori Git, dengan integrasi terbaik dengan GitHub, dan juga mendukung opsi self-hosted seperti Gitea, sistem file, atau iCloud Drive. Aplikasi ini mendukung sintaks Markdown yang kaya dengan ekstensi untuk membuat papan Kanban, papan tulis berbasis Excalidraw, dan mencakup fitur seperti notasi musik Mermaid dan ABC.

Reaksi

  • NotesHub adalah aplikasi pencatatan serbaguna berbasis Markdown yang tersedia di berbagai platform, termasuk iOS, Android, Windows, Mac, Apple Vision Pro, dan Web. Aplikasi ini menawarkan versi Progressive Web App gratis, sementara versi asli memerlukan pembayaran satu kali, dengan integrasi kuat untuk menyimpan catatan di repositori Git seperti GitHub, GitLab, atau Bitbucket. Aplikasi ini menampilkan sintaks Markdown yang kaya, papan Kanban, dan papan tulis berbasis Excalidraw, dengan pengguna memuji desainnya yang bersih dan kemampuan offline-nya, meskipun tidak bersifat open-source dan memiliki dukungan Linux yang terbatas.

Switch orang mati tanpa ketergantungan pada infrastruktur Anda

  • Proyek Go baru, Deadcheck, telah dikembangkan untuk berfungsi sebagai saklar mati tanpa bergantung pada cron jobs, timer, atau basis data. Deadcheck terintegrasi dengan PagerDuty, sebuah platform manajemen insiden yang populer, untuk menjaga insiden tetap tertunda hingga ada check-in yang terlewat, pada titik mana ia memicu peringatan. Proyek ini terkenal karena pendekatannya yang inovatif dalam mengelola peringatan dan insiden tanpa ketergantungan pada penjadwalan tradisional atau basis data.

Reaksi

  • Deadcheck adalah proyek Go yang dirancang sebagai saklar mati, menghilangkan kebutuhan untuk pekerjaan cron atau basis data, dan terintegrasi dengan PagerDuty untuk mengelola peringatan.
  • Teks tersebut telah memicu diskusi tentang saklar orang mati, termasuk aspek hukum dan solusi alternatif seperti menggunakan pengacara atau sistem blockchain.
  • Pengguna telah menyarankan layanan yang ada seperti Cronitor atau OpsGenie untuk fungsi serupa, dan proyek ini berencana untuk memperluas integrasi di luar PagerDuty.

Memahami Keterbatasan Penalaran Matematika dalam Model Bahasa Besar

  • The paper "GSM-Symbolic" oleh Iman Mirzadeh et al. menyelidiki kemampuan penalaran matematis dari Model Bahasa Besar (LLM) menggunakan tolok ukur GSM8K. Para penulis memperkenalkan GSM-Symbolic, sebuah tolok ukur baru dengan template simbolik, yang menunjukkan bahwa LLM kesulitan dengan variasi dalam nilai numerik dan klausa tambahan dalam pertanyaan. Studi ini menunjukkan bahwa LLM mungkin mereplikasi penalaran dari data pelatihan daripada melakukan penalaran logis yang sebenarnya, menyoroti keterbatasan mereka dalam penalaran matematis.

Reaksi

  • Model Bahasa Besar (LLMs) menghadapi tantangan dalam penalaran matematis, terutama ketika masalah mencakup informasi yang tidak relevan, yang mempengaruhi kinerja mereka. Keterbatasan ini menyoroti ketergantungan LLM pada pengenalan pola dibandingkan penalaran logis, membuat mereka kurang efektif dalam skenario dunia nyata dengan detail yang tidak penting. Meskipun ada kemajuan, LLM masih kesulitan membedakan informasi penting dari gangguan, sebuah keterampilan penting yang dibutuhkan untuk aplikasi praktis.

ARIA: Model Campuran Ahli Asli Multimodal Terbuka

  • Aria adalah model AI asli multimodal terbuka yang mengintegrasikan beragam informasi dunia nyata untuk pemahaman yang komprehensif, melampaui model seperti Pixtral-12B dan Llama3.2-11B dalam kinerja. Ini adalah model campuran ahli dengan 3,9 miliar dan 3,5 miliar parameter yang diaktifkan per token visual dan teks, masing-masing, meningkatkan kemampuan bahasa dan multimodalnya. Bobot dan basis kode model ini bersifat sumber terbuka, memudahkan adopsi dan adaptasi oleh pengembang dan peneliti.

Reaksi

  • ARIA adalah model Mixture-of-Experts (MoE) multimodal baru yang melampaui Pixtral-12B dan Llama3.2-11B dalam kinerja dan kecepatan inferensi dengan memanfaatkan parameter aktif secara efisien. Meskipun penggunaan memorinya mirip dengan model 25B, ARIA berkinerja seperti model 10B dan beroperasi secepat model 4B, menjadikannya cocok untuk perangkat dengan memori yang memadai, seperti M2 Max. Para ahli model ini berfokus pada sintaksis, dengan ruang untuk perbaikan dalam pemilihan ahli, dan saat ini tersedia untuk pengujian, meskipun beberapa pengguna mengalami masalah platform.