Passa al contenuto principale

2024-09-13

Note sui nuovi modelli o1 chain-of-thought di OpenAI

  • OpenAI ha rilasciato due nuovi modelli, o1-preview e o1-mini, con nome in codice "strawberry", che offrono capacità di ragionamento migliorate attraverso un modello di suggerimento a catena di pensieri.
  • Questi modelli sono riservati per gli account di livello 5 (oltre $1.000 in crediti API) e introducono "token di ragionamento" che vengono addebitati ma non sono visibili nella risposta dell'API, suscitando un certo malcontento a causa della mancanza di trasparenza.
  • I nuovi modelli possono gestire meglio i prompt complessi e hanno aumentato le quote di token di output, ampliando i potenziali compiti risolvibili dai grandi modelli di linguaggio (LLM).

Reazioni

  • Le nuove catene di pensiero o1 di OpenAI producono ancora allucinazioni, come librerie e funzioni inesistenti, e spesso forniscono fatti errati.
  • Gli utenti osservano che, sebbene le capacità di ragionamento siano migliorate, i modelli non riescono ancora a verificare l'accuratezza fattuale dei loro output, rendendo necessario un doppio controllo da parte degli utenti.
  • Alcuni utenti paragonano i modelli a stagisti ingenui ma intelligenti, suggerendo che possono essere utili con una guida adeguata, sebbene manchino della capacità di fare domande chiarificatrici o ammettere incertezze, influenzando la loro affidabilità.

Investigatori di dati che hanno individuato cattiva condotta nella ricerca assolti dall'accusa di diffamazione

  • Un tribunale ha assolto i ricercatori di Data Colada dall'accusa di diffamazione per aver identificato dati manipolati in un'indagine della Harvard Business School.
  • Harvard dovrà comunque affrontare il processo per la gestione del caso, nonostante abbia confermato la cattiva condotta della professoressa Francesca Gino, che è in congedo amministrativo e potrebbe perdere la cattedra.
  • Il tribunale ha stabilito che le conclusioni supportate da prove non costituiscono diffamazione, scagionando completamente il team di Data Colada grazie al loro approccio prudente e basato su prove.

Reazioni

  • Investigatori di dati accusati di diffamazione per aver identificato cattiva condotta nella ricerca sono stati scagionati, con il caso archiviato prima della fase istruttoria.
  • Il tribunale ha stabilito che le conclusioni supportate da prove riguardanti dati falsificati non costituiscono diffamazione, sostenendo l'integrità scientifica.
  • Gli imputati hanno raccolto oltre 300.000 dollari su GoFundMe per la loro difesa legale, evidenziando i costi elevati e il peso emotivo delle cause per diffamazione negli Stati Uniti.

Boeing, i lavoratori votano per lo sciopero

  • Decine di migliaia di operai della Boeing hanno votato in massa per lo sciopero dopo aver respinto un'offerta contrattuale, con il 96% di sostegno da parte dell'International Association of Machinists and Aerospace Workers District 751.
  • Lo sciopero, iniziato fuori dagli stabilimenti della Boeing nello stato di Washington, potrebbe costare all'azienda circa 1 miliardo di dollari a settimana e interrompere il suo recupero dalle sfide finanziarie e di sicurezza.
  • Nonostante un aumento salariale proposto del 25% in quattro anni e benefici migliorati, l'accordo non ha soddisfatto le altre richieste del sindacato; Boeing è pronta a tornare ai negoziati e l'amministrazione Biden sta monitorando la situazione.

Reazioni

  • Boeing, i lavoratori hanno votato per lo sciopero, con il 96% che ha respinto un accordo proposto che includeva un significativo aumento salariale.
  • Il sindacato dei macchinisti sta chiedendo una migliore retribuzione, condizioni di lavoro migliorate e che Boeing "smetta di infrangere la legge."
  • Lo sciopero sottolinea un'insoddisfazione più ampia nei confronti della gestione di Boeing, criticata per aver dato priorità ai profitti rispetto alla qualità ingegneristica e alla sicurezza, contribuendo a problemi come gli incidenti del 737 Max.

FDA autorizza il primo software per apparecchi acustici da banco

Reazioni

  • Il FDA ha approvato il primo software per apparecchi acustici da banco, consentendo l'uso degli AirPods come apparecchi acustici, potenzialmente riducendo lo stigma e aumentando l'accessibilità.
  • Si prevede che questa approvazione ridurrà i costi e incoraggerà più persone a affrontare la loro perdita uditiva, sebbene permangano preoccupazioni riguardo alla durata della batteria e alla percezione sociale.
  • Gli utenti hanno riportato esperienze positive con le funzionalità di accessibilità degli apparecchi acustici e degli AirPods, segnando un passo significativo verso la rendere gli apparecchi acustici più accessibili e accettati.

Intero staff dell'editore di giochi Annapurna Interactive si è dimesso, secondo quanto riferito

  • Il personale al completo di Annapurna Interactive, compreso l'ex presidente Nathan Gary, si è dimesso dopo un tentativo fallito di scorporare l'azienda in un'entità indipendente.
  • Le attuali partite e progetti di Annapurna Interactive rimarranno sotto la compagnia, con Hector Sanchez recentemente nominato presidente dell'interattivo e dei nuovi media.
  • Annapurna prevede di integrare le sue operazioni di gioco con le sue divisioni di film, TV e teatro, continuando a pubblicare giochi come Lorelei and the Laser Eyes e Open Roads, con titoli in arrivo come Blade Runner 2033: Labyrinth.

Reazioni

  • Il personale al completo di Annapurna Interactive, un editore di videogiochi, si è dimesso a causa di negoziati falliti con la loro società madre, Annapurna Pictures, riguardo all'integrazione finanziaria.
  • I membri del personale e i dirigenti hanno preferito scindersi per mantenere il controllo sulla loro direzione creativa, soprattutto dopo il successo di giochi come 'Outer Wilds' e 'Stray.'
  • Questa dimissione di massa evidenzia la tensione tra l'indipendenza creativa e le pressioni finanziarie all'interno dell'industria dei videogiochi.

Alla tua startup serve un'infrastruttura cloud complessa?

  • Pieter Levels sostiene l'uso di infrastrutture più semplici, utilizzando server singoli invece di configurazioni cloud complesse, per concentrarsi sull'adattamento prodotto-mercato, come discusso nel Lex Friedman Podcast.
  • Due studi di caso evidenziano le insidie di configurazioni eccessivamente complicate: uno con funzioni Lambda eccessive e un altro con microservizi non necessari, entrambi a scapito dello sviluppo delle funzionalità.
  • Server moderni e strumenti come Docker Compose possono fornire soluzioni potenti, gestibili ed economiche, permettendo a piccoli team di concentrarsi sulla creazione di ottimi prodotti piuttosto che sulla gestione di infrastrutture complesse.

Reazioni

  • Le startup spesso adottano infrastrutture cloud complesse come Kubernetes per la scalabilità, ma questo può portare a scarsa qualità e alti costi a causa di decisioni immature del team.
  • Alcuni professionisti esperti sostengono che configurazioni più semplici e riproducibili utilizzando strumenti come Puppet e sistemi LTS (Long-Term Support) possono essere più efficienti ed economiche.
  • Il dibattito mette in evidenza i compromessi tra gli approcci moderni cloud-native e i metodi tradizionali e deterministici per la gestione dell'infrastruttura.

Portare SBCL su Nintendo Switch

  • Charles Zhang e Shinmera hanno lavorato per due anni per portare il motore di gioco Trial su Nintendo Switch, concentrandosi sull'adattamento del runtime Common Lisp.
  • Nonostante la compilazione e l'esecuzione del codice Lisp sulla Switch siano state eseguite con successo, rimangono problemi irrisolti come la gestione della memoria e l'uscita audio, con un costo del progetto di circa $17.000.
  • Il chip ARM64 Cortex-A57 della Switch e il supporto OpenGL hanno reso possibile il porting, ma rimangono delle sfide, come l'interfacciamento con il sistema operativo proprietario della Switch e l'ottimizzazione della compilazione CLOS.

Reazioni

  • SBCL (Steel Bank Common Lisp) viene portato su Nintendo Switch, il che è significativo per lo sviluppo di giochi in Common Lisp grazie alla sua valutazione interattiva del codice e ai cicli di sviluppo rapidi.
  • Il progetto è guidato da Shinmera, che si occupa della portabilità e dell'architettura di costruzione, evidenziando le sfide tecniche e i potenziali benefici dell'esecuzione di SBCL su hardware di gioco specializzato.
  • È necessario utilizzare l'SDK (Software Development Kit) ufficiale di Nintendo per pubblicare giochi su Switch, poiché gli SDK homebrew non sono supportati per le versioni retail delle console.

Chi possiede Nebula?

  • Nebula è un servizio di streaming video on-demand incentrato su contenuti educativi, creato da creatori di contenuti ma non realmente di loro proprietà.
  • Standard Broadcast possiede l'83,125% di Nebula, CuriosityStream possiede il 16,875% e i creatori possiedono direttamente lo 0%, sebbene ricevano il 50% dei profitti e dei proventi da una vendita.
  • Creatori hanno 'equità ombra,' il che significa che sono compensati come proprietari senza possedere azioni effettive, sollevando interrogativi sull'allineamento della piattaforma con i valori dei creatori.

Reazioni

  • Nebula è di proprietà di Standard Broadcast LLC, con 44 creatori che possiedono equity ombra invece della proprietà diretta per evitare problemi logistici e fiscali.
  • Se Nebula viene venduta, i creatori ricevono il 50% dei proventi, ma alcuni sostengono che la struttura manchi di trasparenza e di una vera proprietà cooperativa.
  • Critici affermano che il marketing è fuorviante poiché i creatori non hanno partecipazioni dirette o controllo su Nebula.

FlowTracker – Traccia i dati che fluiscono attraverso i programmi Java

  • FlowTracker è un agente Java progettato per tracciare il flusso di dati all'interno dei programmi Java, aiutando a comprendere l'origine e il significato degli output.
  • Offre un tutorial video e una demo dal vivo per consentire agli utenti di esplorare le sue funzionalità.
  • Ulteriori informazioni e l'accesso allo strumento sono disponibili sulla sua pagina GitHub: https://github.com/coekie/flowtracker.

Reazioni

  • FlowTracker è un agente Java progettato per tracciare il flusso di dati nei programmi Java, aiutando a comprendere gli output del programma.
  • Gli utenti paragonano FlowTracker a strumenti come jitwatch e il tracciamento dinamico delle contaminazioni, evidenziando il suo potenziale per la risoluzione dei problemi e il tracciamento dell'origine dei dati.
  • Il demo mostra la sua capacità di tracciare un elemento HTML fino all'istruzione SQL che lo ha aggiunto al database, generando entusiasmo per la sua integrazione in vari ambienti di sviluppo.

Criptografia a curve ellittiche “25519” con prestazioni migliori

  • AWS ha migliorato le prestazioni e la correttezza della crittografia a curve ellittiche "25519" nella sua libreria open-source, AWS LibCrypto (AWS-LC), attraverso il ragionamento automatico e ottimizzazioni specifiche per CPU.
  • Questi miglioramenti, basati su BoringSSL di Google, includono significativi guadagni di prestazioni per gli algoritmi x25519 ed Ed25519 su CPU x86_64 e Arm64, con le operazioni di firma Ed25519 che vedono un aumento del 108% e le operazioni x25519 che migliorano del 113%.
  • Le migliorie garantiscono un'esecuzione a tempo costante per prevenire attacchi a canale laterale, con la correttezza verificata dalla libreria s2n-bignum e dal dimostratore di teoremi HOL Light, rendendo AWS-LC una scelta robusta per implementazioni crittografiche sicure.

Reazioni

  • Il nuovo sistema di crittografia a curve ellittiche "25519" di Amazon dimostra significativi miglioramenti delle prestazioni, in particolare con un'implementazione ottimizzata AVX512 dal team Firedancer che supera OpenSSL.
  • Il algoritmo x25519 è utilizzato in TLS 1.3 e negli schemi ibridi SSH per l'accordo di chiavi post-quantistiche, evidenziando la sua importanza nei moderni protocolli crittografici.
  • Il codice di Firedancer, noto per l'ottimizzazione della blockchain, è apprezzato per le sue prestazioni e le pratiche di programmazione sicure, contribuendo alla più ampia adozione di ed25519 rispetto a RSA per le chiavi SSH grazie a migliori prestazioni, sicurezza e compatibilità.

Invito al calendario Zero-Click – Catena di vulnerabilità critica zero-click in macOS

  • Una vulnerabilità zero-click in macOS Calendar ha permesso agli aggressori di aggiungere o eliminare file all'interno del sandbox di Calendar, potenzialmente portando all'esecuzione di codice dannoso e compromettendo i dati di iCloud Photos.
  • Apple ha risolto queste vulnerabilità tra ottobre 2022 e settembre 2023, affrontando problemi come la scrittura/eliminazione arbitraria di file, l'esecuzione di codice remoto e l'accesso ai dati sensibili delle foto.
  • Il chain di exploit ha coinvolto più passaggi per aggirare la sicurezza di macOS, inclusa l'evasione del sandbox, il bypass di Gatekeeper e la circonvenzione della protezione TCC, con correzioni implementate in vari aggiornamenti di macOS.

Reazioni

  • Una vulnerabilità critica zero-click in macOS consente agli aggressori di inviare inviti di calendario dannosi con allegati di file, potenzialmente rubando Foto di iCloud senza interazione dell'utente.
  • Gli utenti stanno mettendo in discussione la sicurezza di tali inviti e suggerendo di inserire nella lista bianca mittenti specifici come precauzione.
  • Apple è stata lenta a pagare le ricompense per queste vulnerabilità, sollevando preoccupazioni riguardo al loro impegno per la privacy degli utenti e gli aggiornamenti tempestivi.

Notepat – Computer Estetico

Reazioni

  • "Notepat" è un progetto di arte digitale di Jeffrey Scudder, accessibile tramite il sito web aesthetic.computer, che presenta un ambiente di calcolo retrò e strumenti unici per creare arte digitale.
  • Il progetto include elementi interattivi come un'app 'notepat' per la creazione musicale, con comandi e un layout di tastiera distintivo basato sulla scala cromatica.
  • Gli utenti possono esplorare varie funzionalità, comprese le esperienze VR come "Freaky Flowers", e il progetto ha generato un notevole interesse per il suo approccio innovativo e artistico agli strumenti digitali.

Meta ha alimentato la sua IA con tutto ciò che gli adulti hanno pubblicato pubblicamente dal 2007

  • Meta utilizza post e foto pubblici di Facebook e Instagram dal 2007 per addestrare i suoi modelli di intelligenza artificiale, a meno che gli utenti non impostino i loro post come privati.
  • Gli utenti europei possono rinunciare a questo utilizzo dei dati a causa delle leggi locali sulla privacy, ma gli utenti di altre regioni, inclusa l'Australia, non hanno questa opzione.
  • Meta non ha fornito dettagli chiari sulle specifiche del suo utilizzo dei dati e sulla tempistica di raccolta, sollevando preoccupazioni sulla privacy tra gli utenti.

Reazioni

  • Meta utilizza i post pubblici degli adulti dal 2007 per addestrare la sua IA, suscitando un dibattito sull'etica e la legalità dell'uso dei dati pubblici per l'addestramento dell'IA.
  • Critici si preoccupano che il lavoro dei creatori venga copiato senza consenso, sollevando interrogativi sull'uso corretto e sulle leggi sul diritto d'autore.
  • Il dibattito sottolinea la tensione tra il progresso tecnologico e la protezione dei diritti individuali.

Una frana in Groenlandia ha causato un'onda anomala che ha scosso la Terra per nove giorni

  • In agosto 2023, una frana nel Dickson Fjord della Groenlandia ha causato uno tsunami alto 110 metri, creando un'onda stazionaria che è durata per nove giorni.
  • All'inizio i sismologi hanno identificato l'onda come un "oggetto sismico non identificato" (USO) con una frequenza di 11 millihertz, innescato dall'assottigliamento dei ghiacciai indotto dal cambiamento climatico.
  • Il particolare profilo e le caratteristiche del fiordo hanno intrappolato l'energia dell'onda, mettendo in evidenza l'impatto significativo del cambiamento climatico sui fenomeni geologici della Terra.

Reazioni

  • Una frana in Groenlandia ha provocato uno tsunami alto 110 metri, inizialmente notato quando un ex dipendente ha visto una stazione di ricerca SIRIUS abbandonata spazzata via dopo che una nave da crociera si era arenata.
  • Lo tsunami, inizialmente alto 7 metri, è stato rilevato entro una settimana a causa dell'incidente della crociera, sebbene i dati sismici lo avrebbero rivelato comunque.
  • Dispositivi sismologici in tutto il mondo hanno registrato l'evento, che è durato nove giorni, evidenziando come eventi casuali possano portare a scoperte significative.

Wallops: Un client IRC moderno per il classico Mac OS

  • Wallops, un moderno client IRC per il classico Mac OS, ha rilasciato la versione 2.0, compatibile con System 6 e versioni successive, e include aggiornamenti significativi e correzioni di bug.
  • Le caratteristiche principali includono un'interfaccia a schede per connessioni multiple, canali e messaggi privati, ridimensionamento delle finestre e ordinamento ottimizzato della lista dei nickname per canali di grandi dimensioni.
  • Wallops 2.0 introduce anche nuovi comandi, elementi dell'interfaccia migliorati e miglioramenti delle prestazioni, rendendolo uno strumento robusto per gli utenti IRC su sistemi Mac classici.

Reazioni

  • Wallops è un moderno client IRC (Internet Relay Chat) progettato per il classico Mac OS, suscitando interesse tra gli appassionati di informatica vintage.
  • Il rilascio ha suscitato entusiasmo a causa della rarità di nuovo software per vecchi sistemi, con gli utenti che ricordano con nostalgia le loro esperienze con i Mac classici.
  • Alcuni utenti hanno notato miglioramenti nell'emulazione Mac, suggerendo strumenti come MAME (Multiple Arcade Machine Emulator) per coloro che non dispongono di hardware vintage funzionante.