Gå til hovedinnhold

2024-09-13

Notities over OpenAI's nieuwe o1-keten-van-gedachten modellen

  • OpenAI heeft twee nieuwe modellen uitgebracht, o1-preview en o1-mini, met de codenaam 'strawberry,' die verbeterde redeneervermogens bieden door middel van een keten van gedachte-aanmoedigingspatroon.
  • Deze modellen zijn gereserveerd voor tier 5-accounts ($1.000+ aan API-kredieten) en introduceren 'redeneringstokens' die worden gefactureerd maar niet zichtbaar zijn in de API-respons, wat enige ontevredenheid veroorzaakt vanwege het gebrek aan transparantie.
  • De nieuwe modellen kunnen complexe prompts beter verwerken en hebben een verhoogde output-token-toelage, waardoor de potentiële taken die door grote taalmodellen (LLM's) kunnen worden opgelost, worden uitgebreid.

Reaksjoner

  • De nieuwe o1 chain-of-thought-modellen van OpenAI produceren nog steeds hallucinaties, zoals niet-bestaande bibliotheken en functies, en geven vaak onjuiste feiten.
  • Gebruikers merken op dat hoewel redeneervermogen is verbeterd, de modellen er nog steeds niet in slagen de feitelijke nauwkeurigheid van hun output te verifiëren, waardoor gebruikers dubbel moeten controleren.
  • Enkele gebruikers vergelijken de modellen met naïeve maar intelligente stagiairs, wat suggereert dat ze nuttig kunnen zijn met de juiste begeleiding, hoewel ze het vermogen missen om verduidelijkende vragen te stellen of onzekerheid toe te geven, wat hun betrouwbaarheid beïnvloedt.

Data speurders die onderzoekswangedrag ontdekten, vrijgesproken van laster

  • Een rechtbank heeft de Data Colada-onderzoekers vrijgesproken van laster voor het identificeren van gemanipuleerde gegevens in een onderzoek van de Harvard Business School.
  • Harvard zal nog steeds terechtstaan voor de behandeling van de zaak, ondanks het bevestigen van wangedrag door professor Francesca Gino, die met administratief verlof is en haar vaste aanstelling kan verliezen.
  • De rechtbank oordeelde dat conclusies ondersteund door bewijs geen laster zijn, waardoor het Data Colada-team volledig werd vrijgesproken vanwege hun voorzichtige, op bewijs gebaseerde benadering.

Reaksjoner

  • Data speurders beschuldigd van laster voor het identificeren van onderzoekswangedrag zijn vrijgesproken, met de zaak afgewezen vóór ontdekking.
  • De rechtbank oordeelde dat conclusies ondersteund door bewijzen over vervalste gegevens geen laster vormen, ter ondersteuning van wetenschappelijke integriteit.
  • De beklaagden haalden meer dan $300.000 op via GoFundMe voor hun juridische verdediging, wat de hoge kosten en emotionele belasting van lasterzaken in de VS benadrukt.

Boeing-werknemers stemmen voor staking

  • Tiotusener av Boeing-maskinister stemte overveldende for å streike etter å ha avvist et kontraktstilbud, med 96 % støtte fra International Association of Machinists and Aerospace Workers District 751.
  • De staking, die begon buiten Boeings fabrieken in de staat Washington, kan het bedrijf naar schatting $1 miljard per week kosten en zijn herstel van financiële en veiligheidsuitdagingen verstoren.
  • Ondanks een voorgestelde loonsverhoging van 25% over vier jaar en verbeterde voordelen, voldeed de deal niet aan andere eisen van de vakbond; Boeing is bereid om terug te keren naar de onderhandelingen, en de regering-Biden houdt de situatie in de gaten.

Reaksjoner

  • Boeing-werknemers hebben gestemd om te staken, waarbij 96% een voorgesteld akkoord met een aanzienlijke loonsverhoging heeft afgewezen.
  • De vakbond voor machinisten eist betere betaling, verbeterde arbeidsomstandigheden en dat Boeing 'ophoudt met het overtreden van de wet.'
  • De staking benadrukt een bredere ontevredenheid over het management van Boeing, dat bekritiseerd wordt voor het prioriteren van winsten boven technische kwaliteit en veiligheid, wat bijdraagt aan problemen zoals de 737 Max-crashes.

FDA keurt eerste software voor hoortoestellen zonder recept goed

Reaksjoner

  • De FDA heeft de eerste vrij verkrijgbare hoortoestelsoftware goedgekeurd, waardoor AirPods als hoortoestellen kunnen worden gebruikt, wat mogelijk het stigma vermindert en de toegankelijkheid vergroot.
  • Deze goedkeuring wordt verwacht de kosten te verlagen en meer mensen aan te moedigen hun gehoorverlies aan te pakken, hoewel zorgen over de levensduur van de batterij en de sociale perceptie blijven bestaan.
  • Gebruikers hebben positieve ervaringen gemeld met de toegankelijkheidsfuncties van hoortoestellen en AirPods, wat een belangrijke stap markeert in de richting van het betaalbaarder en geaccepteerder maken van hoortoestellen.

Het volledige personeel van game-uitgever Annapurna Interactive is naar verluidt opgestapt

  • Het hele personeel van Annapurna Interactive, inclusief voormalig president Nathan Gary, heeft ontslag genomen na een mislukte poging om het bedrijf af te splitsen tot een onafhankelijke entiteit.
  • De bestaande spellen en projecten van Annapurna Interactive zullen onder het bedrijf blijven, met Hector Sanchez die onlangs is aangesteld als president van interactieve en nieuwe media.
  • Annapurna is van plan om haar gamingactiviteiten te integreren met haar film-, tv- en theaterafdelingen, en blijft games uitgeven zoals Lorelei and the Laser Eyes en Open Roads, met aankomende titels zoals Blade Runner 2033: Labyrinth.

Reaksjoner

  • Het hele personeel van Annapurna Interactive, een game-uitgever, heeft ontslag genomen vanwege mislukte onderhandelingen met hun moederbedrijf, Annapurna Pictures, over financiële integratie.
  • Het personeel en de leidinggevenden gaven de voorkeur aan een afsplitsing om de controle over hun creatieve richting te behouden, vooral na het succes van spellen zoals 'Outer Wilds' en 'Stray'.
  • Deze massale ontslagname benadrukt de spanning tussen creatieve onafhankelijkheid en financiële druk binnen de game-industrie.

Heeft jouw startup complexe cloudinfrastructuur nodig?

  • Pieter Levels pleit voor eenvoudigere infrastructuur, waarbij hij gebruik maakt van enkele servers in plaats van complexe cloudopstellingen, om zich te concentreren op product-markt fit, zoals besproken in de Lex Friedman Podcast.
  • Uit twee casestudy's blijkt de valkuilen van te ingewikkelde opstellingen: een met een overdaad aan Lambda-functies en een andere met onnodige microservices, die beide afbreuk doen aan de ontwikkeling van functies.
  • Moderne servers en tools zoals Docker Compose kunnen krachtige, beheersbare en budgetvriendelijke oplossingen bieden, waardoor kleine teams zich kunnen concentreren op het bouwen van geweldige producten in plaats van het beheren van complexe infrastructuur.

Reaksjoner

  • Startups nemen vaak complexe cloudinfrastructuur zoals Kubernetes aan voor schaalbaarheid, maar dit kan leiden tot slechte kwaliteit en hoge kosten door onvolwassen team beslissingen.
  • Enkele ervaren professionals beweren dat eenvoudigere, beter reproduceerbare opstellingen met behulp van tools zoals Puppet en LTS (Long-Term Support) systemen efficiënter en kosteneffectiever kunnen zijn.
  • Het debat benadrukt de afwegingen tussen moderne cloud-native benaderingen en traditionele, deterministische methoden voor het beheren van infrastructuur.

SBCL overzetten naar Nintendo Switch

  • Charles Zhang en Shinmera werken al twee jaar aan het porten van de Trial-game-engine naar de Nintendo Switch, met de nadruk op het aanpassen van de Common Lisp-runtime.
  • Ondanks het succesvol compileren en uitvoeren van Lisp-code op de Switch, blijven onopgeloste problemen zoals garbage collection en audio-uitvoer bestaan, met een projectkost van ongeveer $17.000.
  • De ARM64 Cortex-A57-chip van de Switch en de ondersteuning van OpenGL maakten de port mogelijk, maar er blijven uitdagingen, zoals het interfacen met het eigen besturingssysteem van de Switch en het optimaliseren van de CLOS-compilatie.

Reaksjoner

  • SBCL (Steel Bank Common Lisp) wordt overgezet naar de Nintendo Switch, wat belangrijk is voor game-ontwikkeling in Common Lisp vanwege de interactieve code-evaluatie en snelle ontwikkelingscycli.
  • Het project wordt geleid door Shinmera, die verantwoordelijk is voor de portabiliteit en de bouwarchitectuur, en de technische uitdagingen en potentiële voordelen van het draaien van SBCL op gespecialiseerde gamehardware benadrukt.
  • Het gebruik van de officiële Nintendo SDK (Software Development Kit) is noodzakelijk voor het uitgeven van spellen op de Switch, aangezien homebrew SDK's niet worden ondersteund voor retail console releases.

Wie is de eigenaar van Nebula?

  • Nebula is een video-on-demand streamingdienst die zich richt op educatieve inhoud, gebouwd door contentmakers maar niet echt eigendom van hen.
  • Standard Broadcast bezit 83,125% van Nebula, CuriosityStream bezit 16,875%, en makers bezitten direct 0%, hoewel ze 50% van de winst en opbrengsten uit een verkoop ontvangen.
  • Creators hebben 'schaduwvermogen,' wat betekent dat ze worden gecompenseerd als eigenaren zonder daadwerkelijk aandelen te bezitten, wat vragen oproept over de afstemming van het platform met de waarden van de makers.

Reaksjoner

  • Nebula is eigendom van Standard Broadcast LLC, met 44 makers die schaduwaandelen hebben in plaats van direct eigendom om logistieke en fiscale problemen te vermijden.
  • Als Nebula wordt verkocht, ontvangen de makers 50% van de opbrengst, maar sommigen beweren dat de structuur transparantie en echte coöperatieve eigendom mist.
  • Critici beweren dat de marketing misleidend is omdat makers geen directe aandelen of controle over Nebula hebben.

FlowTracker – Volg gegevens die door Java-programma's stromen

  • FlowTracker is een Java-agent ontworpen om de gegevensstroom binnen Java-programma's te volgen, wat helpt bij het begrijpen van de oorsprong en betekenis van outputs.
  • Het biedt een videotutorial en een live demo voor gebruikers om de functionaliteiten te verkennen.
  • Meer informatie en toegang tot het hulpmiddel zijn te vinden op de GitHub-pagina: https://github.com/coekie/flowtracker.

Reaksjoner

  • FlowTracker is een Java-agent ontworpen om de gegevensstroom in Java-programma's te volgen, wat helpt bij het begrijpen van programmas-uitvoer.
  • Gebruikers vergelijken FlowTracker met tools zoals jitwatch en dynamische taint-tracking, waarbij ze de nadruk leggen op het potentieel voor probleemoplossing en het traceren van gegevensherkomst.
  • De demo toont zijn vermogen om een HTML-element terug te traceren naar de SQL-instructie die het aan de database heeft toegevoegd, wat enthousiasme opwekt voor de integratie ervan in verschillende ontwikkelomgevingen.

Betere presterende “25519” elliptische-curve cryptografie

  • AWS heeft de prestaties en correctheid van elliptische-curvecryptografie "25519" in zijn open-sourcebibliotheek, AWS LibCrypto (AWS-LC), verbeterd door middel van geautomatiseerde redenering en CPU-specifieke optimalisaties.
  • Deze verbeteringen, gebaseerd op Google's BoringSSL, omvatten aanzienlijke prestatieverbeteringen voor x25519- en Ed25519-algoritmen op x86_64- en Arm64-CPU's, waarbij Ed25519-ondertekeningsoperaties een toename van 108% zien en x25519-operaties met 113% verbeteren.
  • De verbeteringen zorgen voor uitvoering in constante tijd om zij-aanval aanvallen te voorkomen, met correctheid geverifieerd door de s2n-bignum bibliotheek en HOL Light stellingbewijzer, waardoor AWS-LC een robuuste keuze is voor veilige cryptografische implementaties.

Reaksjoner

  • Amazon's nieuwe elliptische-curvecryptografie "25519" toont aanzienlijke prestatieverbeteringen, vooral met een AVX512 geoptimaliseerde implementatie door het Firedancer-team die beter presteert dan OpenSSL.
  • Het x25519-algoritme wordt gebruikt in TLS 1.3 en SSH-hybrideschema's voor post-kwantum sleutelovereenkomsten, wat het belang ervan in moderne cryptografische protocollen benadrukt.
  • De codebase van Firedancer, bekend for blockchain-optimalisatie, wordt geprezen for zijn prestaties en veilige programmeerpraktijken, wat bijdraagt aan de bredere adoptie van ed25519 over RSA voor SSH-sleutels vanwege betere prestaties, veiligheid en compatibiliteit.

Zero-Click Calendar-uitnodiging – Kritieke zero-click kwetsbaarheidsketen in macOS

  • Een zero-click kwetsbaarheid in macOS Calendar stelde aanvallers in staat om bestanden toe te voegen of te verwijderen binnen de Calendar-sandbox, wat mogelijk leidde tot de uitvoering van kwaadaardige code en het compromitteren van iCloud Photos-gegevens.
  • Apple heeft deze kwetsbaarheden tussen oktober 2022 en september 2023 verholpen, waarbij problemen zoals willekeurig bestand schrijven/verwijderen, uitvoering van externe code en toegang tot gevoelige fotogegevens werden aangepakt.
  • De exploitketen bestond uit meerdere stappen om de beveiliging van macOS te omzeilen, waaronder sandbox-ontwijking, Gatekeeper-omzeiling en TCC-beschermingsomzeiling, met oplossingen die in verschillende macOS-updates zijn geïmplementeerd.

Reaksjoner

  • Een kritieke zero-click kwetsbaarheid in macOS stelt aanvallers in staat om kwaadaardige kalenderuitnodigingen met bijlagen te versturen, waardoor mogelijk iCloud-foto's kunnen worden gestolen zonder gebruikersinteractie.
  • Gebruikers stellen vragen over de veiligheid van dergelijke uitnodigingen en suggereren het op de witte lijst zetten van specifieke afzenders als voorzorgsmaatregel.
  • Apple is traag geweest met het uitbetalen van beloningen voor deze kwetsbaarheden, wat zorgen oproept over hun toewijding aan gebruikersprivacy en tijdige updates.

Notepat – Esthetische Computer

Reaksjoner

  • "Notepat" is een digitaal kunstproject van Jeffrey Scudder, toegankelijk via de website aesthetic.computer, met een retro computeromgeving en unieke tools voor het maken van digitale kunst.
  • Het project omvat interactieve elementen zoals een 'notepat'-app voor muziekcreatie, met commando's en een onderscheidende toetsenbordindeling gebaseerd op de chromatische schaal.
  • Gebruikers kunnen verschillende functies verkennen, waaronder VR-ervaringen zoals 'Freaky Flowers', en het project heeft aanzienlijke interesse gewekt vanwege de innovatieve en artistieke benadering van digitale hulpmiddelen.

Meta voedde zijn AI met alles wat volwassenen sinds 2007 openbaar hebben gepost

  • Meta gebruikt sinds 2007 openbare berichten en foto's van Facebook en Instagram om zijn AI-modellen te trainen, tenzij gebruikers hun berichten privé instellen.
  • Europese gebruikers kunnen zich afmelden voor dit datagebruik vanwege lokale privacywetten, maar gebruikers in andere regio's, waaronder Australië, hebben deze optie niet.
  • Meta heeft geen duidelijke details verstrekt over de specificaties van het gebruik en de verzameling van gegevens, wat privacyzorgen bij gebruikers oproept.

Reaksjoner

  • Meta gebruikt sinds 2007 openbare berichten van volwassenen om zijn AI te trainen, wat een debat heeft aangewakkerd over de ethiek en legaliteit van het gebruik van openbare gegevens voor AI-training.
  • Critici maken zich zorgen over het werk van makers dat zonder toestemming wordt gekopieerd, wat vragen oproept over fair use en auteursrechtwetten.
  • De discussie benadrukt de spanning tussen technologische vooruitgang en de bescherming van individuele rechten.

Groenlandse aardverschuiving veroorzaakte een bizarre golf die de aarde negen dagen deed schudden

  • In augustus 2023 veroorzaakte een aardverschuiving in de Dickson Fjord in Groenland een 110 meter hoge tsunami, waardoor een staande golf ontstond die negen dagen duurde.
  • Seismologen identificeerden de golf aanvankelijk als een "onbekend seismisch object" (USO) met een frequentie van 11 millihertz, veroorzaakt door klimaatverandering-geïnduceerde gletsjerverdunning.
  • De unieke vorm en kenmerken van de fjord hielden de energie van de golf vast, wat de aanzienlijke impact van klimaatverandering op de geologische verschijnselen van de aarde benadrukte.

Reaksjoner

  • Een aardverschuiving in Groenland veroorzaakte een 110 meter hoge tsunami, die aanvankelijk werd opgemerkt toen een voormalige werknemer zag dat een verlaten SIRIUS-onderzoeksstation werd weggespoeld nadat een cruiseschip aan de grond was gelopen.
  • De tsunami, die aanvankelijk 7 meter hoog was, werd binnen een week gedetecteerd vanwege het cruiseschipincident, hoewel seismische gegevens het uiteindelijk zouden hebben onthuld.
  • Seismologische apparaten wereldwijd registreerden het evenement, dat negen dagen duurde, en benadrukten hoe willekeurige gebeurtenissen tot belangrijke ontdekkingen kunnen leiden.

Wallops: Een moderne IRC-client voor klassieke Mac OS

  • Wallops, een moderne IRC-client voor klassieke Mac OS, heeft versie 2.0 uitgebracht, compatibel met System 6 en nieuwere versies, en bevat aanzienlijke updates en bugfixes.
  • Belangrijke kenmerken zijn onder andere een tabbladinterface voor meerdere verbindingen, kanalen en privéberichten, het aanpassen van venstergrootte en geoptimaliseerde sortering van nicklijsten voor grote kanalen.
  • Wallops 2.0 introduceert ook nieuwe commando's, verbeterde interface-elementen en prestatieverbeteringen, waardoor het een robuust hulpmiddel is voor IRC-gebruikers op klassieke Mac-systemen.

Reaksjoner

  • Wallops is een moderne IRC (Internet Relay Chat) client ontworpen voor klassieke Mac OS, wat interesse wekt bij liefhebbers van vintage computing.
  • De release heeft opwinding veroorzaakt vanwege de zeldzaamheid van nieuwe software voor oude systemen, waarbij gebruikers terugdenken aan hun ervaringen met klassieke Macs.
  • Enkele gebruikers hebben verbeteringen opgemerkt in Mac-emulatie en suggereren tools zoals MAME (Multiple Arcade Machine Emulator) voor degenen zonder functionerende vintage hardware.