Passa al contenuto principale

2024-10-11

2 H100: come è scoppiata la bolla del noleggio di GPU

  • Il mercato delle GPU ha subito un significativo calo dei prezzi, con le GPU H100 che sono scese da $8/ora a meno di $2/ora a causa di un eccesso di offerta e di dinamiche di domanda in cambiamento. - I fattori che contribuiscono a questo cambiamento includono la rivendita di calcolo riservato, la messa a punto di modelli aperti e una riduzione delle nuove aziende di modelli di base, rendendo il noleggio di GPU più favorevole rispetto all'acquisto. - L'emergere di modelli a peso aperto e alternative più economiche, come le GPU AMD e Intel, sta influenzando il mercato, con un'enfasi crescente sull'inferenza AI e la messa a punto, supportata da piattaforme come Featherless.AI che offrono soluzioni AI convenienti.

Reazioni

  • I prezzi di noleggio delle GPU H100 nel mercato hanno subito un drastico calo, passando da $8/ora a $2/ora, a causa di un eccesso di offerta e della diminuzione della domanda da parte delle nuove aziende di modelli di base.
  • Questa riduzione dei prezzi ha fatto scoppiare la bolla del noleggio di GPU, influenzando gli investitori che avevano investito pesantemente nell'infrastruttura GPU.
  • L'articolo esplora il potenziale per un panorama dell'IA più accessibile con opzioni di calcolo più economiche, sebbene la sostenibilità a lungo termine di questi prezzi bassi e il futuro dell'infrastruttura dell'IA siano incerti.

Robotaxi Tesla

Reazioni

  • Di recente, Tesla ha presentato il suo Robotaxi, sottolineando una visione per i taxi autonomi che contrasta con l'approccio di Waymo, che utilizza hardware costosi come il LiDAR. - Il design del Robotaxi, privo di volante, indica un futuro dipendente dalla piena autonomia, sebbene affronti sfide normative e tecnologiche. - La tecnologia Full Self-Driving (FSD) di Tesla è un argomento di dibattito, con critici che ne mettono in dubbio la prontezza per la guida senza supervisione e sostenitori ottimisti sul suo potenziale.

Cominciare a disabilitare le estensioni installate che utilizzano ancora Manifest V2 in Chrome stabile

  • Google sta eliminando gradualmente Manifest V2 per le estensioni di Chrome, con avvisi e disabilitazione di queste estensioni a partire dai canali pre-stabili dal 9 ottobre 2024.
  • Si incoraggiano gli utenti a passare alle alternative di Manifest V3, con le imprese che hanno tempo fino a giugno 2025 per completare la transizione utilizzando la politica ExtensionManifestV2Availability.
  • Il processo di eliminazione è iniziato il 3 giugno 2024 e il Chrome Web Store non ha accettato nuove estensioni Manifest V2 da giugno 2022 per quelle private e da gennaio 2022 per quelle pubbliche o non elencate.

Reazioni

  • Chrome sta passando dalle estensioni Manifest V2 a Manifest V3, influenzando i blocchi pubblicitari come uBlock Origin limitandone le capacità. - Mentre Chrome sta effettuando questo cambiamento, browser come Firefox, Vivaldi e Brave intendono continuare a supportare Manifest V2 per il momento. - Questo cambiamento ha suscitato discussioni sul controllo degli utenti e sulla privacy, con alcuni utenti che stanno considerando di passare a browser alternativi per mantenere funzionalità efficaci di blocco degli annunci.

Un compilatore Lisp per RISC-V scritto in Lisp

  • uLisp è una versione del linguaggio di programmazione Lisp progettata per microcontrollori, supportando piattaforme come Arduino, Raspberry Pi ed ESP32. Include funzionalità come il debugging, l'interfaccia per schede SD e le interfacce seriali I2C/SPI, con esempi per applicazioni come il lampeggio di LED e la registrazione dei dati. Una caratteristica significativa è il compilatore Lisp per RISC-V, che compila le funzioni Lisp in codice macchina, supportando funzioni ricorsive e ottimizzazione delle chiamate di coda per migliorare le prestazioni.

Reazioni

  • Un compilatore Lisp per RISC-V, scritto in Lisp, è in fase di sviluppo ma manca di alcune operazioni e funzioni per essere auto-compilante. - Il compilatore supporta funzioni Lisp di base come car e cdr, ma non è ancora completo. - uLisp è evidenziato per la sua semplicità e idoneità per i microcontrollori, con RISC-V che rappresenta una piattaforma attraente per gli appassionati di tecnologia e hacker.

Nobel per la Pace 2024 assegnato a Nihon Hidankyo

  • Il Premio Nobel per la Pace 2024 è stato assegnato a Nihon Hidankyo, un'organizzazione giapponese di sopravvissuti alla bomba atomica, conosciuti come Hibakusha, per la loro difesa di un mondo senza nucleare. - Gli Hibakusha hanno contribuito in modo significativo a stabilire il "tabù nucleare", una norma globale contro l'uso delle armi nucleari, attraverso le loro testimonianze incisive. - Questo riconoscimento è in linea con la visione di Alfred Nobel di onorare gli sforzi che beneficiano l'umanità e continua a ispirare nuove generazioni verso il disarmo nucleare.

Reazioni

  • Il Premio Nobel per la Pace 2024 è stato assegnato a Nihon Hidankyo, un'organizzazione giapponese che si batte contro le armi nucleari, sottolineando la minaccia persistente delle armi nucleari in mezzo alle tensioni globali. Questo premio serve come promemoria dell'impatto devastante della guerra nucleare, come esemplificato da Hiroshima e Nagasaki, e sottolinea l'importanza del disarmo. La discussione sul premio coinvolge anche le complessità della deterrenza nucleare, del diritto internazionale e delle dinamiche geopolitiche tra le potenze nucleari.

Alternative a WordPress

  • Il articolo è stato aggiornato per includere più alternative ai Content Management System (CMS) a causa dell'aumento di interesse, in particolare alla luce della situazione attuale di WordPress. - L'elenco presenta opzioni CMS scaricabili come Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail e Textpattern, escludendo i CMS basati su API e git. - Menzioni degne di nota includono Ghost per le sue funzionalità di email integrate, Kirby per il suo approccio basato su file e ClassicPress come un fork di WordPress guidato dalla comunità, mentre alcuni CMS come Anchor non sono più mantenuti.

Reazioni

  • Jekyll su GitHub Pages è consigliato per blog semplici che utilizzano Markdown, offrendo facilità d'uso senza richiedere configurazioni locali e permettendo la portabilità dei contenuti tra piattaforme.
  • Alternative a WordPress per il blogging includono Chyrp Lite, Typecho, Quartz e Logseq, mentre Drupal, ProcessWire e Wagtail offrono maggiore flessibilità per gli sviluppatori.
  • Generatori di siti statici come Astro e Publii stanno diventando sempre più popolari, e per l'hosting delle immagini, sono suggerite opzioni come S3+Cloudfront o CloudFlare.

Google Play ha eliminato il mio gioco e non mi dirà perché

  • Tukkun, uno sviluppatore di giochi indie, ha lavorato su "Anti-Idle: Reborn", che è stato approvato da Google e Apple, ed è stato in Closed Beta per un mese. Il 7 ottobre 2024, Google ha terminato l'account di Tukkun citando "violazioni precedenti" e "comportamento ad alto rischio", ma non ha fornito una spiegazione chiara, influenzando il suo lavoro e il suo reddito. Questa situazione mette in evidenza un problema più ampio in cui gli sviluppatori sperimentano terminazioni di account vaghe, sollecitando richieste di maggiore trasparenza e chiarezza da parte di piattaforme come Google.

Reazioni

  • Google Play ha rimosso il gioco di uno sviluppatore senza spiegazioni, sottolineando il controllo significativo che le aziende tecnologiche hanno sugli sviluppatori.
  • Incidenti simili sono stati segnalati con Amazon e Google, dove account o app vengono banditi senza motivi chiari o supporto adeguato.
  • Si incoraggia gli sviluppatori a diversificare le loro piattaforme per mitigare i rischi, poiché questa situazione mette in evidenza preoccupazioni più ampie riguardo al servizio clienti dei giganti tecnologici e ai rischi di dipendenza derivanti dalla costruzione di imprese sulle loro piattaforme.

Nurdle Patrol

Reazioni

  • In 2023, 221 container marittimi sono stati persi in mare, un numero esiguo rispetto ai 250 milioni spediti annualmente, evidenziando la portata delle operazioni di spedizione globali.
  • Le palline di plastica, note come nurdles, sono inquinanti visibili sulle spiagge e possono degradarsi in microplastiche, entrando nella catena alimentare e rappresentando un potenziale pericolo, sebbene non siano la principale fonte di inquinamento plastico marino.
  • La discussione sull'inquinamento da plastica sottolinea la sua complessità e l'impatto globale, inclusi i problemi di esportazione dei rifiuti dai paesi sviluppati a quelli in via di sviluppo e la potenziale adattamento degli ecosistemi all'inquinamento da plastica, sollevando preoccupazioni sull'uso futuro della plastica.

Lezioni iniziali sulle prestazioni di CUDA

  • Malte Skarupke discute la sua esperienza nell'apprendimento di CUDA, osservando che è essenzialmente C++ con funzionalità aggiuntive per il calcolo parallelo.
  • Le lezioni chiave per ottimizzare le prestazioni di CUDA includono il coalescing della memoria, la comprensione dei vari tipi di memoria e la massimizzazione del parallelismo utilizzando molti thread e separando i compiti in diversi kernel.
  • Skarupke sottolinea che scrivere in CUDA è simile a risolvere un puzzle, dove l'attenzione principale dovrebbe essere rivolta all'esecuzione di compiti in parallelo prima di ottimizzare per la velocità.

Reazioni

  • Il dibattito si concentra sull'ottimizzazione del codice CUDA per le prestazioni della GPU, specificamente per un trigger di esperimento LHC (Large Hadron Collider), gestendo registri, memoria condivisa e blocchi di thread.
  • Si sottolineano i compromessi tra occupazione (il numero di thread attivi), utilizzo dei registri e latenze della memoria, evidenziando l'evoluzione dei vincoli di programmazione in CUDA.
  • Il discorso confronta le prestazioni di GPU e CPU, evidenziando le differenze nel consumo energetico e nelle capacità computazionali, e sottolinea l'importanza di bilanciare l'occupazione e le prestazioni per i futuri progressi hardware e software.

FBI ha creato una moneta per indagare sugli schemi di pump-and-dump delle criptovalute

  • Il FBI ha sviluppato una criptovaluta basata su Ethereum, NexFundAI, per indagare ed esporre schemi di pump-and-dump nel settore delle criptovalute, portando a significative azioni legali.- Sono state presentate accuse contro 18 individui ed entità per frode e manipolazione del mercato, con la Securities and Exchange Commission che ha preso di mira tre market maker e altri nove per aver gonfiato i prezzi degli asset crittografici.- Il Dipartimento di Giustizia ha recuperato con successo 25 milioni di dollari in proventi fraudolenti, che saranno restituiti agli investitori, evidenziando l'efficacia dell'operazione nel combattere le frodi crittografiche.

Reazioni

  • Il FBI ha sviluppato una criptovaluta per indagare sugli schemi di pump-and-dump, che sono pratiche fraudolente che gonfiano artificialmente il prezzo di un bene prima di venderlo.
  • Questa iniziativa ha acceso dibattiti sull'intrappolamento e le implicazioni etiche delle forze dell'ordine che creano titoli contraffatti.
  • La discussione si estende a preoccupazioni più ampie sulla legittimità delle criptovalute e sul ruolo del governo nella regolamentazione delle valute digitali.

NotesHub: app per prendere appunti multipiattaforma basata su Markdown

  • L'app è disponibile su più piattaforme, tra cui iOS, Android, Windows, Mac, Apple Vision Pro e il Web, con la versione Web che è una Progressive Web App gratuita che funziona offline. - Le note possono essere archiviate in repository Git, con la migliore integrazione con GitHub, e supportano anche opzioni self-hosted come Gitea, file system o iCloud Drive. - L'app supporta una sintassi Markdown avanzata con estensioni per creare bacheche Kanban, lavagne basate su Excalidraw e include funzionalità come la notazione musicale Mermaid e ABC.

Reazioni

  • NotesHub è un'app per prendere appunti versatile, basata su Markdown, disponibile su più piattaforme, tra cui iOS, Android, Windows, Mac, Apple Vision Pro e il Web. L'app offre una versione gratuita come Progressive Web App, mentre le versioni native richiedono un pagamento una tantum, con una forte integrazione per memorizzare appunti in repository Git come GitHub, GitLab o Bitbucket. Presenta una sintassi Markdown ricca, bacheche Kanban e lavagne basate su Excalidraw, con utenti che elogiano il suo design pulito e le capacità offline, anche se non è open-source e ha un supporto limitato per Linux.

Interruttore a uomo morto senza dipendenza dalla tua infrastruttura

  • Un nuovo progetto Go, Deadcheck, è stato sviluppato per funzionare come un interruttore a uomo morto senza fare affidamento su cron job, timer o database. Deadcheck si integra con PagerDuty, una popolare piattaforma di gestione degli incidenti, per mantenere gli incidenti in sospensione fino a quando non viene mancato un check-in, a quel punto attiva un avviso. Questo progetto è degno di nota per il suo approccio innovativo alla gestione degli avvisi e degli incidenti senza dipendenze da pianificazioni tradizionali o database.

Reazioni

  • Deadcheck è un progetto Go progettato come un interruttore a uomo morto, eliminando la necessità di cron job o database, e si integra con PagerDuty per gestire gli avvisi.
  • Il progetto ha suscitato discussioni sui dispositivi di sicurezza a uomo morto, inclusi gli aspetti legali e soluzioni alternative come l'uso di avvocati o sistemi blockchain.
  • Gli utenti hanno suggerito servizi esistenti come Cronitor o OpsGenie per funzionalità simili, e il progetto prevede di espandere le integrazioni oltre PagerDuty.

Comprendere i limiti del ragionamento matematico nei modelli di linguaggio di grandi dimensioni

  • Il documento "GSM-Symbolic" di Iman Mirzadeh et al. esamina le capacità di ragionamento matematico dei modelli di linguaggio di grandi dimensioni (LLM) utilizzando il benchmark GSM8K. Gli autori introducono GSM-Symbolic, un nuovo benchmark con modelli simbolici, dimostrando che gli LLM faticano con variazioni nei valori numerici e clausole aggiuntive nelle domande. Lo studio suggerisce che gli LLM potrebbero replicare il ragionamento dai dati di addestramento piuttosto che eseguire un vero ragionamento logico, evidenziando le loro limitazioni nel ragionamento matematico.

Reazioni

  • Grandi modelli linguistici (LLM) affrontano sfide nel ragionamento matematico, in particolare quando i problemi includono informazioni irrilevanti, il che influisce sulle loro prestazioni. Questa limitazione evidenzia la dipendenza degli LLM dal riconoscimento dei modelli piuttosto che dal ragionamento logico, rendendoli meno efficaci in scenari reali con dettagli superflui. Nonostante i progressi, gli LLM continuano a lottare per distinguere le informazioni importanti dal rumore, una competenza critica necessaria per applicazioni pratiche.

ARIA: Un modello aperto multimodale nativo a miscela di esperti

  • Aria è un modello AI nativo multimodale aperto che integra diverse informazioni del mondo reale per una comprensione completa, superando modelli come Pixtral-12B e Llama3.2-11B in termini di prestazioni. È un modello a miscela di esperti con 3,9 miliardi e 3,5 miliardi di parametri attivati per token visivo e testuale, rispettivamente, migliorando le sue capacità linguistiche e multimodali. I pesi e il codice sorgente del modello sono open-source, facilitando l'adozione e l'adattamento da parte di sviluppatori e ricercatori.

Reazioni

  • ARIA è un nuovo modello multimodale nativo Mixture-of-Experts (MoE) che supera Pixtral-12B e Llama3.2-11B in termini di prestazioni e velocità di inferenza utilizzando in modo efficiente i parametri attivi. Nonostante abbia un utilizzo di memoria simile a un modello da 25B, ARIA si comporta come un modello da 10B e opera rapidamente come un modello da 4B, rendendolo adatto per dispositivi con memoria adeguata, come un M2 Max. Gli esperti del modello si concentrano sulla sintassi, con margini di miglioramento nella selezione degli esperti, ed è attualmente disponibile per il test, sebbene alcuni utenti abbiano riscontrato problemi con la piattaforma.