Hop til hovedindhold

2024-09-13

Noter om OpenAIs nye o1 chain-of-thought modeller

  • OpenAI har udgivet to nye modeller, o1-preview og o1-mini, med kodenavnet "strawberry," som tilbyder forbedrede ræsonneringsevner gennem et tankekæde-promptmønster.
  • Disse modeller er forbeholdt niveau 5-konti ($1.000+ på API-kreditter) og introducerer "reasoning tokens", som faktureres, men ikke er synlige i API-svaret, hvilket skaber en vis utilfredshed på grund af manglende gennemsigtighed.
  • De nye modeller kan håndtere komplekse prompt bedre og har øget tilladelsen til output-token, hvilket udvider de potentielle opgaver, der kan løses af store sprogmodeller (LLM'er).

Reaktioner

  • OpenAI's nye o1 chain-of-thought-modeller producerer stadig hallucinationer, såsom ikke-eksisterende biblioteker og funktioner, og giver ofte forkerte fakta.
  • Brugere bemærker, at selvom ræsonneringsevnerne er blevet forbedret, fejler modellerne stadig i at verificere den faktuelle nøjagtighed af deres output, hvilket nødvendiggør, at brugerne dobbeltkontrollerer.
  • Visse brugere sammenligner modellerne med naive, men intelligente praktikanter og antyder, at de kan være nyttige med korrekt vejledning, selvom de mangler evnen til at stille afklarende spørgsmål eller indrømme usikkerhed, hvilket påvirker deres pålidelighed.

Data-detektiver, der opdagede forskningsmisbrug, frikendt for injurier

  • En domstol har frikendt Data Colada-forskerne for injurier efter at have identificeret manipulerede data i en undersøgelse ved Harvard Business School.
  • Harvard vil stadig stå over for en retssag om sin håndtering af sagen, på trods af at have bekræftet forseelse af professor Francesca Gino, som er på administrativ orlov og kan miste sin fastansættelse.
  • Retten fastslog, at konklusioner understøttet af beviser ikke er injurierende, og frikendte fuldstændigt Data Colada-teamet på grund af deres forsigtige, evidensbaserede tilgang.

Reaktioner

  • Datasporhunde anklaget for injurier for at identificere forskningsmisbrug er blevet frikendt, idet sagen blev afvist før opdagelse.
  • Retten fastslog, at konklusioner understøttet af beviser om fabrikerede data ikke udgør injurier, hvilket støtter videnskabelig integritet.
  • De tiltalte indsamlede over $300.000 på GoFundMe til deres juridiske forsvar, hvilket fremhæver de høje omkostninger og den følelsesmæssige belastning ved ærekrænkelsessager i USA.

Boing-arbejdere stemmer for strejke

  • Titusindvis af Boeing-maskinarbejdere stemte overvældende for at strejke efter at have afvist et kontrakttilbud, med 96% støtte fra International Association of Machinists and Aerospace Workers District 751.
  • Strejken, som begyndte uden for Boeings fabrikker i staten Washington, kan koste virksomheden anslået 1 milliard dollars om ugen og forstyrre dens genopretning fra økonomiske og sikkerhedsmæssige udfordringer.
  • På trods af et foreslået lønforhøjelse på 25% over fire år og forbedrede fordele, opfyldte aftalen ikke andre fagforeningskrav; Boeing er klar til at vende tilbage til forhandlingerne, og Biden-administrationen overvåger situationen.

Reaktioner

  • Boing-arbejdere har stemt for at strejke, idet 96% afviste et foreslået tilbud, der indeholdt en betydelig lønforhøjelse.
  • Maskinarbejdernes fagforening kræver bedre løn, forbedrede arbejdsvilkår og at Boeing "stopper med at bryde loven."
  • Strejken understreger en bredere utilfredshed med Boeings ledelse, som kritiseres for at prioritere profit over ingeniørkvalitet og sikkerhed, hvilket har bidraget til problemer som 737 Max-ulykkerne.

FDA godkender den første håndkøbssoftware til høreapparater

Reaktioner

  • FDA har godkendt den første håndkøbssoftware til høreapparater, hvilket gør det muligt at bruge AirPods som høreapparater, hvilket potentielt reducerer stigma og øger tilgængeligheden.
  • Det forventes, at denne godkendelse vil sænke omkostningerne og opmuntre flere personer til at tage hånd om deres høretab, selvom bekymringer om batterilevetid og social opfattelse stadig består.
  • Brugere har rapporteret positive oplevelser med tilgængelighedsfunktionerne i høreapparater og AirPods, hvilket markerer et betydeligt skridt mod at gøre høreapparater mere overkommelige og accepterede.

Samtlige ansatte hos spiludgiveren Annapurna Interactive har angiveligt sagt op

  • Samtlige medarbejdere hos Annapurna Interactive, inklusive den tidligere præsident Nathan Gary, har trukket sig efter et mislykket forsøg på at udskille virksomheden som en uafhængig enhed.
  • Annapurna Interactives eksisterende spil og projekter vil forblive under virksomheden, med Hector Sanchez for nylig udnævnt som præsident for interaktive og nye medier.
  • Annapurna planlægger at integrere sine spiloperationer med sine film-, tv- og teaterafdelinger og fortsætte med at udgive spil som Lorelei and the Laser Eyes og Open Roads, med kommende titler som Blade Runner 2033: Labyrinth.

Reaktioner

  • Samtlige medarbejdere hos Annapurna Interactive, en spiludgiver, har sagt op på grund af mislykkede forhandlinger med deres moderselskab, Annapurna Pictures, om økonomisk integration.
  • Personalet og lederne foretrak at udskille sig for at bevare kontrollen over deres kreative retning, især efter succesen med spil som "Outer Wilds" og "Stray."
  • Denne masseafgang fremhæver spændingen mellem kreativ uafhængighed og økonomiske pres inden for spilindustrien.

Har din startup brug for kompleks cloud-infrastruktur?

  • Pieter Levels går ind for enklere infrastruktur ved at bruge enkeltstående servere i stedet for komplekse cloud-opsætninger for at fokusere på produkt-markedstilpasning, som diskuteret i Lex Friedman Podcast.
  • To casestudier fremhæver faldgruberne ved overkomplicerede opsætninger: en med overdrevne Lambda-funktioner og en anden med unødvendige mikroservices, som begge fjerner fokus fra udviklingen af funktioner.
  • Moderne servere og værktøjer som Docker Compose kan levere kraftfulde, håndterbare og budgetvenlige løsninger, der gør det muligt for små teams at fokusere på at bygge fremragende produkter i stedet for at administrere kompleks infrastruktur.

Reaktioner

  • Startups adopterer ofte kompleks cloud-infrastruktur som Kubernetes for skalerbarhed, men dette kan føre til dårlig kvalitet og høje omkostninger på grund af umodne teambeslutninger.
  • Enkelte erfarne fagfolk hævder, at enklere, mere reproducerbare opsætninger ved brug af værktøjer som Puppet og LTS (Long-Term Support) systemer kan være mere effektive og omkostningsbesparende.
  • Debatten fremhæver afvejningerne mellem moderne cloud-native tilgange og traditionelle, deterministiske metoder til styring af infrastruktur.

Portering af SBCL til Nintendo Switch

  • Charles Zhang og Shinmera har arbejdet i to år på at portere Trial-spilmotoren til Nintendo Switch med fokus på at tilpasse Common Lisp-runtime.
  • På trods af at det lykkedes at kompilere og køre Lisp-kode på Switch, er der uløste problemer med affaldsindsamling og lydudgang, og projektet har kostet omkring $17.000.
  • Switch'ens ARM64 Cortex-A57 chip og OpenGL-understøttelse gjorde porteringen mulig, men der er stadig udfordringer, såsom at interagere med Switch'ens proprietære OS og optimere CLOS-kompilering.

Reaktioner

  • SBCL (Steel Bank Common Lisp) bliver portet til Nintendo Switch, hvilket er betydningsfuldt for spiludvikling i Common Lisp på grund af dets interaktive kodeevaluering og hurtige udviklingscyklusser.
  • Projektet ledes af Shinmera, som håndterer portabiliteten og byggearkitekturen, og fremhæver de tekniske udfordringer og potentielle fordele ved at køre SBCL på specialiseret spillehardware.
  • Brugen af den officielle Nintendo SDK (Software Development Kit) er nødvendig for at udgive spil på Switch, da homebrew SDK'er ikke understøttes til detailkonsoludgivelser.

Who Owns Nebula?

  • Nebula er en video-on-demand streamingtjeneste med fokus på uddannelsesindhold, skabt af indholdsskabere, men ikke reelt ejet af dem.
  • Standard Broadcast ejer 83,125% af Nebula, CuriosityStream ejer 16,875%, og skaberne ejer direkte 0%, selvom de modtager 50% af overskuddet og provenuet fra et salg.
  • Skabere har 'skyggekapital,' hvilket betyder, at de bliver kompenseret som ejere uden at have faktiske aktier, hvilket rejser spørgsmål om platformens overensstemmelse med skabernes værdier.

Reaktioner

  • Nebula ejes af Standard Broadcast LLC, med 44 skabere, der har skyggekapital i stedet for direkte ejerskab for at undgå logistiske og skattemæssige problemer.
  • Bliver Nebula solgt, modtager skaberne 50% af indtægterne, men nogle hævder, at strukturen mangler gennemsigtighed og ægte kooperativt ejerskab.
  • Critics claim the marketing is misleading since creators don't have direct equity or control over Nebula.

FlowTracker – Spor data, der flyder gennem Java-programmer

  • FlowTracker er en Java-agent designet til at spore dataflow inden for Java-programmer, hvilket hjælper med at forstå oprindelsen og betydningen af output.
  • Den tilbyder en videotutorial og en live demo, så brugerne kan udforske dens funktioner.
  • Yderligere information og adgang til værktøjet kan findes på dets GitHub-side: https://github.com/coekie/flowtracker.

Reaktioner

  • FlowTracker er en Java-agent designet til at spore dataflow i Java-programmer, hvilket hjælper med at forstå programudgange.
  • Brugere sammenligner FlowTracker med værktøjer som jitwatch og dynamisk taint tracking, hvilket fremhæver dets potentiale for fejlfinding og sporing af dataoprindelse.
  • Demonstrationen viser dens evne til at spore et HTML-element tilbage til den SQL-udtalelse, der tilføjede det til databasen, hvilket skaber begejstring for dens integration i forskellige udviklingsmiljøer.

Bedre ydende “25519” elliptisk kurve kryptografi

  • AWS har forbedret ydeevnen og korrektheden af "25519" elliptisk-kurve kryptografi i sit open-source bibliotek, AWS LibCrypto (AWS-LC), gennem automatiseret ræsonnering og CPU-specifikke optimeringer.
  • Disse forbedringer, baseret på Googles BoringSSL, inkluderer betydelige ydeevneforbedringer for x25519- og Ed25519-algoritmer på x86_64- og Arm64-CPU'er, hvor Ed25519-signeringsoperationer ser en stigning på 108%, og x25519-operationer forbedres med 113%.
  • De forbedringer sikrer konstant-tids udførelse for at forhindre sidekanalangreb, med korrekthed verificeret af s2n-bignum-biblioteket og HOL Light-sætningbeviseren, hvilket gør AWS-LC til et robust valg for sikre kryptografiske implementeringer.

Reaktioner

  • Amazon's nye "25519" elliptiske kurve-kryptografi demonstrerer betydelige ydeevneforbedringer, især med en AVX512-optimeret implementering af Firedancer-teamet, der overgår OpenSSL.
  • Algoritmen x25519 bruges i TLS 1.3 og SSH hybridordninger til post-kvantet nøgleaftale, hvilket understreger dens betydning i moderne kryptografiske protokoller.
  • Firedancers kodebase, kendt for blockchain-optimering, er rost for sin ydeevne og sikre programmeringspraksis, hvilket bidrager til den bredere anvendelse af ed25519 over RSA til SSH-nøgler på grund af bedre ydeevne, sikkerhed og kompatibilitet.

Zero-Click Kalenderinvitation – Kritisk zero-click sårbarhedskæde i macOS

  • En zero-click sårbarhed i macOS Kalender tillod angribere at tilføje eller slette filer inden for Kalender-sandkassen, hvilket potentielt kunne føre til udførelse af ondsindet kode og kompromittering af iCloud Fotos data.
  • Apple løste disse sårbarheder mellem oktober 2022 og september 2023, hvor de adresserede problemer som vilkårlig filskrivning/-sletning, fjernudførelse af kode og adgang til følsomme fotodata.
  • Udnyttelseskæden involverede flere trin for at omgå macOS-sikkerhed, herunder sandbox-unddragelse, Gatekeeper-omgåelse og TCC-beskyttelsesomgåelse, med rettelser implementeret i forskellige macOS-opdateringer.

Reaktioner

  • En kritisk zero-click sårbarhed i macOS tillader angribere at sende ondsindede kalenderinvitationer med filvedhæftninger, hvilket potentielt kan stjæle iCloud-fotos uden brugerinteraktion.
  • Brugere stiller spørgsmålstegn ved sikkerheden af sådanne invitationer og foreslår at hvidliste specifikke afsendere som en forholdsregel.
  • Apple har været langsomme til at udbetale dusører for disse sårbarheder, hvilket har rejst bekymringer om deres engagement i brugerens privatliv og rettidige opdateringer.

Notepat – Æstetisk Computer

Reaktioner

  • "Notepat" er et digitalt kunstprojekt af Jeffrey Scudder, tilgængeligt via hjemmesiden aesthetic.computer, der præsenterer et retro computer-miljø og unikke værktøjer til at skabe digital kunst.
  • Projektet inkluderer interaktive elementer som en 'notepat'-app til musikskabelse, med kommandoer og et karakteristisk tastaturlayout baseret på den kromatiske skala.
  • Brugere kan udforske forskellige funktioner, herunder VR-oplevelser som "Freaky Flowers," og projektet har skabt betydelig interesse for sin innovative og kunstneriske tilgang til digitale værktøjer.

Meta fodrede sin AI med alt, hvad voksne offentligt har postet siden 2007

  • Meta har brugt offentlige opslag og fotos fra Facebook og Instagram siden 2007 til at træne sine AI-modeller, medmindre brugerne har sat deres opslag til privat.
  • Europæiske brugere kan fravælge denne dataanvendelse på grund af lokale privatlivslove, men brugere i andre regioner, herunder Australien, har ikke denne mulighed.
  • Meta har ikke givet klare detaljer om specifikationerne for sin dataanvendelse og indsamlingstidslinje, hvilket vækker bekymring om privatlivets fred blandt brugerne.

Reaktioner

  • Meta har siden 2007 brugt offentlige opslag fra voksne til at træne sin AI, hvilket har udløst en debat om etikken og lovligheden af at bruge offentlige data til AI-træning.
  • Kritikere bekymrer sig om, at skaberes arbejde bliver kopieret uden samtykke, hvilket rejser spørgsmål om fair use og ophavsretslove.
  • Diskussionen understreger spændingen mellem teknologiske fremskridt og beskyttelsen af individuelle rettigheder.

Grønlandsk jordskred forårsagede en usædvanlig bølge, der rystede Jorden i ni dage

  • I august 2023 forårsagede et jordskred i Grønlands Dickson Fjord en 110 meter høj tsunami, der skabte en stående bølge, som varede i ni dage.
  • Seismologer identificerede oprindeligt bølgen som et "uidentificeret seismisk objekt" (USO) med en frekvens på 11 millihertz, udløst af klimaforandringer-induceret gletsjertynding.
  • Fjordens unikke form og træk fangede bølgens energi, hvilket fremhævede den betydelige indvirkning af klimaforandringer på Jordens geologiske fænomener.

Reaktioner

  • Et jordskred i Grønland udløste en 110 meter høj tsunami, som først blev bemærket, da en tidligere medarbejder så en forladt SIRIUS-forskningsstation blive skyllet væk efter et krydstogtskib gik på grund.
  • Den tsunami, der oprindeligt var 7 meter høj, blev opdaget inden for en uge på grund af krydstogtsulykken, selvom seismiske data til sidst ville have afsløret den.
  • Seismologiske enheder verden over registrerede begivenheden, som varede ni dage, og fremhævede, hvordan tilfældige hændelser kan føre til betydelige opdagelser.

Wallops: En moderne IRC-klient til klassisk Mac OS

  • Wallops, en moderne IRC-klient til klassisk Mac OS, har udgivet version 2.0, som er kompatibel med System 6 og nyere versioner, og inkluderer betydelige opdateringer og fejlrettelser.
  • Vigtige funktioner inkluderer en fanebaseret grænseflade til flere forbindelser, kanaler og private beskeder, vinduesændring og optimeret sortering af kaldenavnelister for store kanaler.
  • Wallops 2.0 introducerer også nye kommandoer, forbedrede grænsefladeelementer og ydeevneforbedringer, hvilket gør det til et robust værktøj for IRC-brugere på klassiske Mac-systemer.

Reaktioner

  • Wallops er en moderne IRC (Internet Relay Chat) klient designet til klassisk Mac OS, hvilket vækker interesse blandt entusiaster af vintage computing.
  • Udgivelsen har vakt begejstring på grund af sjældenheden af ny software til gamle systemer, hvor brugere mindes deres oplevelser med klassiske Macs.
  • Enkelte brugere har bemærket forbedringer i Mac-emulering og foreslår værktøjer som MAME (Multiple Arcade Machine Emulator) til dem uden fungerende vintage hardware.