Hoppa till huvudinnehåll

2024-09-13

Anteckningar om OpenAIs nya o1 chain-of-thought-modeller

  • OpenAI har släppt två nya modeller, o1-preview och o1-mini, med kodnamnet "strawberry," som erbjuder förbättrade resonemangsförmågor genom ett tankekedjemönster.
  • De här modellerna är reserverade för nivå 5-konton ($1,000+ på API-krediter) och introducerar "resonemangstoken" som debiteras men inte syns i API-svaret, vilket har väckt viss missnöje på grund av bristande transparens.
  • De nya modellerna kan hantera komplexa uppmaningar bättre och har ökat tillåtna utmatningstoken, vilket utökar de potentiella uppgifter som kan lösas av stora språkmodeller (LLM).

Reaktioner

  • OpenAIs nya o1 chain-of-thought-modeller producerar fortfarande hallucinationer, såsom icke-existerande bibliotek och funktioner, och ger ofta felaktiga fakta.
  • Användare observerar att även om resonemangsförmågorna har förbättrats, misslyckas modellerna fortfarande med att verifiera den faktiska noggrannheten i sina resultat, vilket kräver att användaren dubbelkollar.
  • Vissa användare liknar modellerna vid naiva men intelligenta praktikanter och föreslår att de kan vara användbara med rätt vägledning, även om de saknar förmågan att ställa klargörande frågor eller erkänna osäkerhet, vilket påverkar deras tillförlitlighet.

Dataspanare som upptäckte forskningsfusk friade från förtal

  • En domstol har friat Data Colada-forskarna från förtal för att ha identifierat manipulerade data i en utredning vid Harvard Business School.
  • Harvard kommer fortfarande att ställas inför rätta för sin hantering av fallet, trots att de bekräftat oegentligheter av professor Francesca Gino, som är på administrativ ledighet och kan förlora sin tjänst.
  • Domstolen fastslog att slutsatser som stöds av bevis inte är förtal, vilket helt friade Data Colada-teamet tack vare deras försiktiga, bevisbaserade tillvägagångssätt.

Reaktioner

  • Dataspanare anklagade för förtal för att ha identifierat forskningsfusk har blivit friade, med fallet avskrivet innan upptäckt.
  • Domstolen fastslog att slutsatser baserade på bevis om fabricerade data inte utgör förtal, vilket stöder vetenskaplig integritet.
  • De tilltalade samlade in över 300 000 dollar på GoFundMe för sitt juridiska försvar, vilket belyser de höga kostnaderna och den känslomässiga påfrestningen av förtalsrättegångar i USA.

Boeningarbetare röstar för strejk

  • Tiotusentals Boeing-mekaniker röstade överväldigande för att strejka efter att ha avvisat ett kontraktsförslag, med 96 % stöd från International Association of Machinists and Aerospace Workers District 751.
  • Strejken, som började utanför Boeings anläggningar i delstaten Washington, kan kosta företaget uppskattningsvis 1 miljard dollar per vecka och störa dess återhämtning från finansiella och säkerhetsrelaterade utmaningar.
  • Trots ett föreslaget löneökning på 25% över fyra år och förbättrade förmåner, uppfyllde avtalet inte andra fackliga krav; Boeing är redo att återvända till förhandlingarna, och Biden-administrationen övervakar situationen.

Reaktioner

  • Boeing-arbetare har röstat för att strejka, med 96% som avvisade ett föreslaget avtal som inkluderade en betydande löneökning.
  • Fackföreningen för maskinister kräver bättre lön, förbättrade arbetsförhållanden och att Boeing ska 'sluta bryta mot lagen.'
  • Strejken understryker en bredare missnöje med Boeings ledning, som kritiseras för att prioritera vinster över ingenjörskvalitet och säkerhet, vilket bidrar till problem som 737 Max-krascherna.

FDA godkänner den första receptfria hörapparatmjukvaran

Reaktioner

  • FDA har godkänt den första receptfria hörapparatprogramvaran, vilket gör det möjligt att använda AirPods som hörapparater, vilket potentiellt minskar stigmat och ökar tillgängligheten.
  • Detta godkännande förväntas sänka kostnaderna och uppmuntra fler individer att ta itu med sin hörselnedsättning, även om oro kring batteritid och social uppfattning kvarstår.
  • Användare har rapporterat positiva upplevelser med tillgänglighetsfunktionerna hos hörapparater och AirPods, vilket markerar ett betydande steg mot att göra hörapparater mer prisvärda och accepterade.

Enligt uppgifter har hela personalen på spelutgivaren Annapurna Interactive sagt upp sig

  • Den samlade personalen på Annapurna Interactive, inklusive den tidigare presidenten Nathan Gary, har avgått efter ett misslyckat försök att avknoppa företaget till en självständig enhet.
  • Annapurna Interactives befintliga spel och projekt kommer att förbli under företaget, med Hector Sanchez nyligen utsedd till president för interaktiv och ny media.
  • Annapurna planerar att integrera sina spelverksamheter med sina film-, TV- och teateravdelningar, och fortsätter att ge ut spel som Lorelei and the Laser Eyes och Open Roads, med kommande titlar som Blade Runner 2033: Labyrinth.

Reaktioner

  • Den samlade personalen på Annapurna Interactive, en spelutgivare, har sagt upp sig på grund av misslyckade förhandlingar med deras moderbolag, Annapurna Pictures, om finansiell integration.
  • Personalen och cheferna föredrog att avknoppa för att behålla kontrollen över sin kreativa riktning, särskilt efter framgången med spel som 'Outer Wilds' och 'Stray'.
  • Denna massiva uppsägning belyser spänningen mellan kreativt oberoende och ekonomiska påtryckningar inom spelindustrin.

Behöver din startup komplex molninfrastruktur?

  • Pieter Levels förespråkar enklare infrastruktur, med användning av enskilda servrar istället för komplexa molnuppsättningar, för att fokusera på produkt-marknadspassning, som diskuterades i Lex Friedman Podcast.
  • Två fallstudier belyser fallgroparna med överkomplicerade uppsättningar: en med överdrivet många Lambda-funktioner och en annan med onödiga mikrotjänster, som båda avleder från funktionsutveckling.
  • Moderna servrar och verktyg som Docker Compose kan erbjuda kraftfulla, hanterbara och kostnadseffektiva lösningar, vilket gör det möjligt för små team att fokusera på att bygga fantastiska produkter istället för att hantera komplex infrastruktur.

Reaktioner

  • Startups antar ofta komplex molninfrastruktur som Kubernetes för skalbarhet, men detta kan leda till dålig kvalitet och höga kostnader på grund av omogna teambeslut.
  • Vissa erfarna yrkesverksamma hävdar att enklare, mer reproducerbara uppsättningar med verktyg som Puppet och LTS (Long-Term Support) system kan vara mer effektiva och kostnadseffektiva.
  • Debatten belyser avvägningarna mellan moderna molnbaserade tillvägagångssätt och traditionella, deterministiska metoder för att hantera infrastruktur.

Portera SBCL till Nintendo Switch

  • Charles Zhang och Shinmera har arbetat i två år med att porta spelmotorn Trial till Nintendo Switch, med fokus på att anpassa Common Lisp-runtime.
  • Trots att Lisp-koden framgångsrikt kompilerades och kördes på Switch, kvarstår olösta problem som skräpsamling och ljudutgång, och projektet kostade cirka 17 000 dollar.
  • Switchens ARM64 Cortex-A57-chip och OpenGL-stöd gjorde portningen möjlig, men utmaningar kvarstår, såsom att interagera med Switchens proprietära operativsystem och optimera CLOS-kompilering.

Reaktioner

  • SBCL (Steel Bank Common Lisp) porteras till Nintendo Switch, vilket är betydelsefullt för spelutveckling i Common Lisp på grund av dess interaktiva kodutvärdering och snabba utvecklingscykler.
  • Projektet leds av Shinmera, som hanterar portabiliteten och byggarkitekturen, och lyfter fram de tekniska utmaningarna och de potentiella fördelarna med att köra SBCL på specialiserad spelhårdvara.
  • Användningen av den officiella Nintendo SDK (Software Development Kit) är nödvändig för att publicera spel på Switch, eftersom hemgjorda SDK:er inte stöds för detaljhandelskonsolutgåvor.

Vem äger Nebula?

  • Nebula är en video-on-demand streamingtjänst som fokuserar på utbildningsinnehåll, skapad av innehållsskapare men inte verkligen ägd av dem.
  • Standard Broadcast äger 83,125% av Nebula, CuriosityStream äger 16,875%, och skaparna äger direkt 0%, även om de får 50% av vinsterna och intäkterna från en försäljning.
  • Skapare har 'skuggeget kapital', vilket innebär att de kompenseras som ägare utan att inneha faktiska aktier, vilket väcker frågor om plattformens överensstämmelse med skaparnas värderingar.

Reaktioner

  • Nebula ägs av Standard Broadcast LLC, med 44 skapare som har skuggeget kapital istället för direkt ägande för att undvika logistiska och skattemässiga problem.
  • Om Nebula säljs, får skaparna 50% av intäkterna, men vissa hävdar att strukturen saknar transparens och verkligt kooperativt ägande.
  • Critics claim the marketing is misleading since creators don't have direct equity or control over Nebula.

FlowTracker – Spåra dataflöde genom Java-program

  • FlowTracker är en Java-agent utformad för att spåra dataflöde inom Java-program, vilket hjälper till att förstå ursprunget och betydelsen av utdata.
  • Den erbjuder en videotutorial och en live-demo för användare att utforska dess funktioner.
  • Mer information och tillgång till verktyget finns på dess GitHub-sida: https://github.com/coekie/flowtracker.

Reaktioner

  • FlowTracker är en Java-agent utformad för att spåra dataflöde i Java-program, vilket hjälper till att förstå programutgångar.
  • Användare jämför FlowTracker med verktyg som jitwatch och dynamisk taint tracking, och framhäver dess potential för felsökning och spårning av dataursprung.
  • Demonstrationen visar dess förmåga att spåra ett HTML-element tillbaka till SQL-satsen som lade till det i databasen, vilket skapar entusiasm för dess integration i olika utvecklingsmiljöer.

Elliptisk kurvkryptografi med bättre prestanda, '25519'

  • AWS har förbättrat prestandan och korrektheten för elliptisk kurvkryptografi "25519" i sitt öppen källkods-bibliotek, AWS LibCrypto (AWS-LC), genom automatiserat resonemang och CPU-specifika optimeringar.
  • De här förbättringarna, baserade på Googles BoringSSL, inkluderar betydande prestandaförbättringar för x25519- och Ed25519-algoritmer på x86_64- och Arm64-CPU:er, där Ed25519-signeringsoperationer ser en ökning på 108% och x25519-operationer förbättras med 113%.
  • Förbättringarna säkerställer exekvering i konstant tid för att förhindra sidokanalsattacker, med korrekthet verifierad av s2n-bignum-biblioteket och HOL Light-satsbevisaren, vilket gör AWS-LC till ett robust val för säkra kryptografiska implementationer.

Reaktioner

  • Amazon's nya elliptiska kurvkryptografi "25519" visar betydande prestandaförbättringar, särskilt med en AVX512-optimerad implementering av Firedancer-teamet som överträffar OpenSSL.
  • Algoritmen x25519 används i TLS 1.3 och SSH-hybridscheman för post-kvant-nyckelavtal, vilket understryker dess betydelse i moderna kryptografiska protokoll.
  • Firedancers kodbas, känd för blockchain-optimering, beröms för sin prestanda och säkra programmeringspraxis, vilket bidrar till den bredare användningen av ed25519 över RSA för SSH-nycklar på grund av bättre prestanda, säkerhet och kompatibilitet.

Zero-Click Kalenderinbjudan – Kritisk sårbarhetskedja utan klick i macOS

  • En zero-click-sårbarhet i macOS Kalender tillät angripare att lägga till eller ta bort filer inom Kalender-sandboxen, vilket potentiellt kunde leda till skadlig kodexekvering och kompromettering av iCloud Photos-data.
  • Apple åtgärdade dessa sårbarheter mellan oktober 2022 och september 2023, och hanterade problem som godtycklig filskrivning/-radering, fjärrkörning av kod och åtkomst till känsliga fotodata.
  • Exploit-kedjan involverade flera steg för att kringgå macOS-säkerhet, inklusive sandbox-undvikande, Gatekeeper-kringgående och TCC-skyddsomgåelse, med åtgärder implementerade i olika macOS-uppdateringar.

Reaktioner

  • En kritisk sårbarhet utan klick i macOS gör det möjligt för angripare att skicka skadliga kalenderinbjudningar med bifogade filer, vilket potentiellt kan stjäla iCloud-foton utan användarinteraktion.
  • Användare ifrågasätter säkerheten med sådana inbjudningar och föreslår att man vitlistar specifika avsändare som en försiktighetsåtgärd.
  • Apple har varit långsamma med att betala ut belöningar för dessa sårbarheter, vilket väcker oro kring deras engagemang för användarens integritet och snabba uppdateringar.

Notepat – Estetisk Dator

Reaktioner

  • "Notepat" är ett digitalt konstprojekt av Jeffrey Scudder, tillgängligt via webbplatsen aesthetic.computer, som erbjuder en retro datoromgivning och unika verktyg för att skapa digital konst.
  • Projektet inkluderar interaktiva element som en 'notepat'-app för musikskapande, med kommandon och en distinkt tangentbordslayout baserad på den kromatiska skalan.
  • Användare kan utforska olika funktioner, inklusive VR-upplevelser som 'Freaky Flowers', och projektet har väckt stort intresse för sitt innovativa och konstnärliga tillvägagångssätt till digitala verktyg.

Meta matade sin AI med allt som vuxna har publicerat offentligt sedan 2007

  • Meta har använt offentliga inlägg och foton från Facebook och Instagram sedan 2007 för att träna sina AI-modeller, om inte användarna har ställt in sina inlägg som privata.
  • Europeiska användare kan välja att inte delta i denna datainsamling på grund av lokala integritetslagar, men användare i andra regioner, inklusive Australien, har inte detta alternativ.
  • Meta har inte gett tydliga detaljer om specifikationerna för sin dataanvändning och insamlingstidslinje, vilket väcker integritetsfrågor bland användare.

Reaktioner

  • Meta har använt offentliga inlägg från vuxna sedan 2007 för att träna sin AI, vilket har väckt en debatt om etiken och lagligheten i att använda offentliga data för AI-träning.
  • Critics oroar sig för att kreatörers verk kopieras utan samtycke, vilket väcker frågor om skälig användning och upphovsrättslagar.
  • Diskussionen understryker spänningen mellan teknologiska framsteg och skyddet av individuella rättigheter.

Grönländskt jordskred orsakade en ovanlig våg som skakade jorden i nio dagar

  • I augusti 2023 orsakade ett jordskred i Dicksonfjorden på Grönland en 110 meter hög tsunami, vilket skapade en stående våg som varade i nio dagar.
  • Seismologer identifierade initialt vågen som ett "oidentifierat seismiskt objekt" (USO) med en frekvens på 11 millihertz, utlöst av klimatförändringsinducerad glaciäruttunning.
  • Fjordens unika form och egenskaper fångade vågens energi, vilket framhävde den betydande påverkan som klimatförändringarna har på jordens geologiska fenomen.

Reaktioner

  • En jordskred på Grönland utlöste en 110 meter hög tsunami, som först upptäcktes när en tidigare anställd såg en övergiven SIRIUS forskningsstation svepas bort efter att ett kryssningsfartyg gått på grund.
  • Den tsunami, som initialt var 7 meter hög, upptäcktes inom en vecka på grund av kryssningsincidenten, även om seismiska data så småningom skulle ha avslöjat den.
  • Seismologiska enheter världen över registrerade händelsen, som varade i nio dagar, vilket belyser hur slumpmässiga händelser kan leda till betydande upptäckter.

Wallops: En modern IRC-klient för klassisk Mac OS

  • Wallops, en modern IRC-klient för klassiska Mac OS, har släppt version 2.0, kompatibel med System 6 och nyare versioner, och inkluderar betydande uppdateringar och buggfixar.
  • Viktiga funktioner inkluderar ett flikbaserat gränssnitt för flera anslutningar, kanaler och privata meddelanden, fönsterstorleksändring och optimerad sortering av smeknamnslistor för stora kanaler.
  • Wallops 2.0 introducerar också nya kommandon, förbättrade gränssnittselement och prestandaförbättringar, vilket gör det till ett robust verktyg för IRC-användare på klassiska Mac-system.

Reaktioner

  • Wallops är en modern IRC-klient (Internet Relay Chat) designad för klassisk Mac OS, vilket väcker intresse bland entusiaster av vintage-datorer.
  • Utgivningen har väckt uppståndelse på grund av sällsyntheten av ny programvara för gamla system, med användare som minns sina upplevelser med klassiska Mac-datorer.
  • Vissa användare har noterat förbättringar i Mac-emulering och föreslår verktyg som MAME (Multiple Arcade Machine Emulator) för dem som saknar fungerande vintagehårdvara.