Ga naar hoofdinhoud

2024-10-11

2 dollar H100-er: Hvordan GPU-utleieboblen sprakk

  • GPU-markedet har opplevd et betydelig prisfall, med H100 GPUer som har gått ned fra $8/t til under $2/t på grunn av overskudd og endrede etterspørselsdynamikker. Faktorer som bidrar til dette skiftet inkluderer videresalg av reserverte beregninger, åpen modellfinjustering, og en reduksjon i nye grunnleggende modellfirmaer, noe som gjør leie av GPUer mer gunstig enn kjøp. Fremveksten av åpne vektmodeller og mer rimelige alternativer, som AMD og Intel GPUer, påvirker markedet, med en økende vekt på AI-inferens og finjustering, støttet av plattformer som Featherless.AI som tilbyr kostnadseffektive AI-løsninger.

Reacties

  • Markedet for leie av GPU har opplevd et dramatisk prisfall for H100 GPUer, fra $8/t til $2/t, på grunn av et overskudd og redusert etterspørsel fra nye grunnleggende modellfirmaer.
  • Dette prisfallet har sprukket GPU-utleieboblen, noe som påvirker investorer som har investert tungt i GPU-infrastruktur.
  • Artikkelen utforsker potensialet for et mer tilgjengelig AI-landskap med billigere beregningsalternativer, selv om den langsiktige bærekraften til disse lave prisene og fremtiden for AI-infrastruktur er usikker.

Tesla Robotaxi

Reacties

  • Tesla viste nylig frem sin Robotaxi, og understreket en visjon for autonome drosjer som står i kontrast til Waymos tilnærming, som bruker kostbar maskinvare som LiDAR. Robotaxiens design, som mangler et ratt, indikerer en fremtid avhengig av full autonomi, selv om den står overfor regulatoriske og teknologiske utfordringer. Teslas Full Self-Driving (FSD)-teknologi er et tema for debatt, med kritikere som stiller spørsmål ved dens beredskap for usupervisert kjøring og støttespillere som er optimistiske med tanke på dens potensial.

Begynn å deaktivere installerte utvidelser som fortsatt bruker Manifest V2 i Chrome stabil

  • Google avvikler Manifest V2 for Chrome-utvidelser, med advarsler og deaktivering av disse utvidelsene som starter på pre-stabile kanaler fra 9. oktober 2024.
  • Brukere oppfordres til å gå over til Manifest V3-alternativer, med virksomheter som har frist til juni 2025 for å fullføre overgangen ved å bruke ExtensionManifestV2Availability-policyen.
  • Utfasingprosessen begynte 3. juni 2024, og Chrome Web Store har ikke akseptert nye Manifest V2-utvidelser siden juni 2022 for private og januar 2022 for offentlige eller ulistede utvidelser.

Reacties

  • Chrome går over fra Manifest V2 til Manifest V3-utvidelser, noe som påvirker annonseblokkere som uBlock Origin ved å begrense deres funksjonalitet. Mens Chrome gjør dette skiftet, har nettlesere som Firefox, Vivaldi og Brave til hensikt å fortsette å støtte Manifest V2 inntil videre. Denne endringen har ført til diskusjoner om brukerkontroll og personvern, med noen brukere som vurderer å bytte til alternative nettlesere for å beholde effektive annonseblokkeringsfunksjoner.

En Lisp-kompilator til RISC-V skrevet i Lisp

  • uLisp er en versjon av programmeringsspråket Lisp designet for mikrokontrollere, og støtter plattformer som Arduino, Raspberry Pi og ESP32. Det inkluderer funksjoner som feilsøking, SD-kortgrensesnitt og I2C/SPI serielle grensesnitt, med eksempler for applikasjoner som LED-blinking og datalogging. En betydelig funksjon er Lisp-kompilatoren for RISC-V, som kompilere Lisp-funksjoner til maskinkode, og støtter rekursive funksjoner og hale-kall optimalisering for forbedret ytelse.

Reacties

  • En Lisp-kompilator for RISC-V, skrevet i Lisp, er under utvikling, men mangler visse operasjoner og funksjoner for å være selvkompilerende. Kompilatoren støtter grunnleggende Lisp-funksjoner som car og cdr, men er ennå ikke fullstendig. uLisp fremheves for sin enkelhet og egnethet for mikrokontrollere, med RISC-V som en attraktiv plattform for teknologientusiaster og hackere.

Fredsprisen for 2024 tildelt Nihon Hidankyo

  • Fredsprisen for 2024 er tildelt Nihon Hidankyo, en japansk organisasjon av atombombeoverlevende, kjent som Hibakusha, for deres arbeid for en atomvåpenfri verden. Hibakusha har betydelig bidratt til å etablere "atomtabuet," en global norm mot bruk av atomvåpen, gjennom deres sterke vitnesbyrd. Denne anerkjennelsen er i tråd med Alfred Nobels visjon om å hedre innsats som gagner menneskeheten og fortsetter å inspirere nye generasjoner mot atomnedrustning.

Reacties

  • Fredsprisen for 2024 ble tildelt Nihon Hidankyo, en japansk organisasjon som arbeider mot atomvåpen, og understreker den vedvarende trusselen fra atomvåpen midt i globale spenninger. Denne prisen fungerer som en påminnelse om de ødeleggende konsekvensene av atomkrigføring, som eksemplifisert av Hiroshima og Nagasaki, og understreker viktigheten av nedrustning. Prisdiskusjonen involverer også kompleksiteten rundt atomavskrekking, internasjonal lovgivning og de geopolitiske dynamikkene blant atommaktene.

WordPress-alternativer

  • Artikkelen har blitt oppdatert for å inkludere flere alternativer for Content Management System (CMS) på grunn av økt interesse, spesielt i lys av den nåværende WordPress-situasjonen. Listen inneholder nedlastbare CMS-alternativer som Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail og Textpattern, med unntak av API- og git-baserte CMS-er. Merkbare omtaler inkluderer Ghost for sine innebygde e-postfunksjoner, Kirby for sin filbaserte tilnærming, og ClassicPress som en fellesskapsdrevet WordPress-fork, mens noen CMS-er som Anchor ikke lenger vedlikeholdes.

Reacties

  • Jekyll på GitHub Pages anbefales for enkle blogger som bruker Markdown, og tilbyr brukervennlighet uten behov for lokal oppsett, samtidig som det tillater innholdsportabilitet på tvers av plattformer.
  • Alternativer til WordPress for blogging inkluderer Chyrp Lite, Typecho, Quartz og Logseq, mens Drupal, ProcessWire og Wagtail gir mer fleksibilitet for utviklere.
  • Statisk nettstedsgeneratorer som Astro og Publii blir stadig mer populære, og for bildehosting foreslås alternativer som S3+Cloudfront eller CloudFlare.

Google Play drepte spillet mitt og vil ikke fortelle meg hvorfor

  • En indie-spillutvikler ved navn Tukkun har arbeidet med "Anti-Idle: Reborn," som ble godkjent av Google og Apple, og har vært i lukket beta i en måned. Den 7. oktober 2024 avsluttet Google Tukkuns konto med henvisning til "tidligere brudd" og "høyrisikoatferd," men ga ingen klar forklaring, noe som påvirket hans arbeid og inntekt. Denne situasjonen fremhever et bredere problem der utviklere opplever vage kontotermineringer, noe som fører til krav om mer åpenhet og klarhet fra plattformer som Google.

Reacties

  • Google Play fjernet et spill fra en utvikler uten forklaring, noe som understreker den betydelige kontrollen teknologiselskaper har over utviklere.
  • Det er rapportert om lignende hendelser med Amazon og Google, der kontoer eller apper blir utestengt uten klare grunner eller tilstrekkelig støtte.
  • Utviklere oppfordres til å diversifisere plattformene sine for å redusere risiko, ettersom denne situasjonen fremhever bredere bekymringer om teknologigigantenes kundeservice og avhengighetsrisikoen ved å bygge virksomheter på plattformene deres.

Plastperlepatrulje

Reacties

  • I 2023 gikk 221 fraktcontainere tapt til sjøs, et mindre antall sammenlignet med de 250 millioner som sendes årlig, noe som fremhever omfanget av globale fraktoperasjoner.
  • Plastpellets, kjent som nurdles, er synlige forurensninger på strender og kan brytes ned til mikroplast, som kommer inn i næringskjeden og utgjør potensiell skade, selv om de ikke er den primære kilden til marin plastforurensning.
  • Diskusjonen om plastforurensning understreker dens kompleksitet og globale påvirkning, inkludert eksport av avfallsproblemer fra utviklede til utviklingsland og potensialet for at økosystemer tilpasser seg plastforurensning, noe som vekker bekymring for fremtidig plastbruk.

Første CUDA-ytelsesleksjoner

  • Malte Skarupke diskuterer sin erfaring med å lære CUDA, og bemerker at det i hovedsak er C++ med tilleggsegenskaper for parallell databehandling.
  • Viktige lærdommer for å optimalisere CUDA-ytelse inkluderer minnesammenslåing, forståelse av ulike minnetyper, og maksimalisering av parallellisme ved å bruke mange tråder og dele oppgaver inn i forskjellige kjerner.
  • Skaupe understreker at det å skrive CUDA er som å løse et puslespill, der hovedfokuset bør være på å kjøre oppgaver parallelt før man optimaliserer for hastighet.

Reacties

  • Diskusjonen fokuserer på å optimalisere CUDA-kode for GPU-ytelse, spesielt for en LHC (Large Hadron Collider) eksperimentutløser, ved å håndtere registre, delt minne og trådblokker.
  • Det understreker avveiningene mellom okkupasjon (antall aktive tråder), registerbruk og minneforsinkelser, og fremhever utviklingen av programmeringsbegrensninger i CUDA.
  • Diskusjonen sammenligner GPU- og CPU-ytelse, bemerker forskjeller i strømforbruk og beregningskapasitet, og understreker viktigheten av å balansere utnyttelse og ytelse for fremtidige fremskritt innen maskinvare og programvare.

FBI opprettet en mynt for å undersøke kryptovaluta pump-og-dump ordninger

  • FBI utviklet en Ethereum-basert kryptovaluta, NexFundAI, for å undersøke og avsløre kryptopump-og-dump-skjemaer, noe som førte til betydelige rettslige tiltak.- Tiltaler ble reist mot 18 individer og enheter for bedrageri og markedsmanipulasjon, med Securities and Exchange Commission som rettet seg mot tre markedsaktører og ni andre for å ha oppblåst kryptovalutapriser.- Justisdepartementet klarte å gjenopprette 25 millioner dollar i bedragerske inntekter, som vil bli returnert til investorer, noe som fremhever operasjonens effektivitet i å bekjempe kryptobedrageri.

Reacties

  • FBI utviklet en kryptovaluta for å undersøke pump-og-dump-skjemaer, som er svindelpraksiser som kunstig oppblåser prisen på en eiendel før den selges.
  • Dette initiativet har utløst debatter om lokking og de etiske implikasjonene av at rettshåndhevelse skaper forfalskede verdipapirer.
  • Diskusjonen utvides til bredere bekymringer om legitimiteten til kryptovalutaer og regjeringens rolle i reguleringen av digitale valutaer.

NotesHub: plattformuavhengig, Markdown-basert notatapp

  • Appen er tilgjengelig på flere plattformer, inkludert iOS, Android, Windows, Mac, Apple Vision Pro og nettet, hvor nettversjonen er en gratis progressiv webapp som fungerer offline. Notater kan lagres i Git-repositorier, med den beste integrasjonen med GitHub, og støtter også selvhostede alternativer som Gitea, filsystemer eller iCloud Drive. Appen støtter rik Markdown-syntaks med utvidelser for å lage Kanban-tavler, Excalidraw-baserte whiteboards, og inkluderer funksjoner som Mermaid og ABC-musikknotasjon.

Reacties

  • NotesHub er en allsidig, Markdown-basert notatapp tilgjengelig på flere plattformer, inkludert iOS, Android, Windows, Mac, Apple Vision Pro og nettet. Appen tilbyr en gratis Progressive Web App-versjon, mens de native versjonene krever en engangsbetaling, med sterk integrasjon for lagring av notater i Git-repositorier som GitHub, GitLab eller Bitbucket. Den har rik Markdown-syntaks, Kanban-tavler og Excalidraw-baserte whiteboards, med brukere som roser dens rene design og offline-funksjonalitet, selv om den ikke er åpen kildekode og har begrenset Linux-støtte.

Dead man's switch uten avhengighet av din infrastruktur

  • Et nytt Go-prosjekt, Deadcheck, har blitt utviklet for å fungere som en dødmannsbryter uten å være avhengig av cron-jobber, tidtakere eller databaser. Deadcheck integreres med PagerDuty, en populær plattform for hendelseshåndtering, for å holde hendelser i dvale inntil en innsjekking blir savnet, hvorpå det utløser en varsling. Dette prosjektet er bemerkelsesverdig for sin innovative tilnærming til å håndtere varsler og hendelser uten tradisjonelle planleggings- eller databaseavhengigheter.

Reacties

  • Deadcheck er et Go-prosjekt designet som en dødmannsbryter, som eliminerer behovet for cron-jobber eller databaser, og integreres med PagerDuty for å håndtere varsler.
  • Prosjektet har utløst diskusjoner om dødmannsbrytere, inkludert juridiske aspekter og alternative løsninger som å bruke advokater eller blokkjedesystemer.
  • Brukere har foreslått eksisterende tjenester som Cronitor eller OpsGenie for lignende funksjonaliteter, og prosjektet planlegger å utvide integrasjoner utover PagerDuty.

Å forstå begrensningene ved matematisk resonnement i store språkmodeller

  • Papiret "GSM-Symbolic" av Iman Mirzadeh et al. undersøker de matematiske resonneringsevner til store språkmodeller (LLMs) ved bruk av GSM8K-referansen. Forfatterne introduserer GSM-Symbolic, en ny referanse med symbolske maler, som viser at LLMs har vanskeligheter med variasjoner i numeriske verdier og tilleggsklausuler i spørsmål. Studien antyder at LLMs kan replikere resonnering fra treningsdata i stedet for å utføre genuin logisk resonnering, og fremhever deres begrensninger i matematisk resonnering.

Reacties

  • Store språkmodeller (LLMs) står overfor utfordringer innen matematisk resonnement, spesielt når problemer inkluderer irrelevant informasjon, noe som påvirker deres ytelse. Denne begrensningen understreker LLMs' avhengighet av mønstergjenkjenning fremfor logisk resonnement, noe som gjør dem mindre effektive i virkelige scenarier med overflødige detaljer. Til tross for fremskritt, sliter LLMs fortsatt med å skille viktig informasjon fra støy, en kritisk ferdighet som trengs for praktiske anvendelser.

ARIA: En åpen multimodal innfødt blanding-av-eksperter-modell

  • Aria er en åpen multimodal innfødt AI-modell som integrerer mangfoldig informasjon fra den virkelige verden for en omfattende forståelse, og overgår modeller som Pixtral-12B og Llama3.2-11B i ytelse. Det er en mixture-of-expert-modell med 3,9 milliarder og 3,5 milliarder aktiverte parametere per henholdsvis visuell og teksttoken, noe som forbedrer dens språk- og multimodale evner. Modellens vekter og kodebase er åpen kildekode, noe som letter enkel adopsjon og tilpasning av utviklere og forskere.

Reacties

  • ARIA er en ny multimodal native Mixture-of-Experts (MoE) modell som overgår Pixtral-12B og Llama3.2-11B i ytelse og inferenshastighet ved effektivt å utnytte aktive parametere. Til tross for at den har et minnebruk som ligner en 25B-modell, presterer ARIA som en 10B-modell og opererer like raskt som en 4B-modell, noe som gjør den egnet for enheter med tilstrekkelig minne, som en M2 Max. Modellens eksperter fokuserer på syntaks, med rom for forbedring i ekspertutvelgelse, og den er for øyeblikket tilgjengelig for testing, selv om noen brukere har opplevd plattformproblemer.