Hoppa till huvudinnehåll

2024-10-11

2 $H100: Hur GPU-uthyrningsbubblan sprack

  • GPU-marknaden har upplevt en betydande prisnedgång, där H100 GPU:er har minskat från $8/timme till under $2/timme på grund av överskott och förändrade efterfrågedynamiker. Faktorer som bidrar till denna förändring inkluderar återförsäljning av reserverad datorkraft, öppen modellfinjustering och en minskning av nya grundmodellföretag, vilket gör att hyra GPU:er blir mer fördelaktigt än att köpa. Framväxten av öppenviktsmodeller och mer prisvärda alternativ, såsom AMD och Intel GPU:er, påverkar marknaden, med ett växande fokus på AI-inferens och finjustering, stödd av plattformar som Featherless.AI som erbjuder kostnadseffektiva AI-lösningar.

Reaktioner

  • Marknaden för GPU-uthyrning har upplevt ett dramatiskt prisfall för H100 GPU:er, från $8/timme till $2/timme, på grund av ett överskott och minskad efterfrågan från nya grundmodellsföretag.
  • Denna prissänkning har spräckt GPU-uthyrningsbubblan, vilket påverkar investerare som satsat stort på GPU-infrastruktur.
  • Artikeln undersöker potentialen för en mer tillgänglig AI-miljö med billigare beräkningsalternativ, även om den långsiktiga hållbarheten för dessa låga priser och framtiden för AI-infrastruktur är osäkra.

Tesla Robotaxi

Reaktioner

  • Tesla visade nyligen upp sin Robotaxi och betonade en vision för autonoma taxibilar som kontrasterar mot Waymos tillvägagångssätt, vilket använder dyr hårdvara som LiDAR. - Robotaxins design, som saknar ratt, indikerar en framtid beroende av full autonomi, även om den står inför reglerings- och teknologiska utmaningar. - Teslas Full Self-Driving (FSD)-teknologi är ett debattämne, där kritiker ifrågasätter dess beredskap för obevakad körning och anhängare är optimistiska om dess potential.

Påbörja inaktivering av installerade tillägg som fortfarande använder Manifest V2 i Chrome stabil.

  • Google fasar ut Manifest V2 för Chrome-tillägg, med varningar och inaktivering av dessa tillägg som börjar på för-stabila kanaler från och med den 9 oktober 2024.
  • Användare uppmanas att övergå till Manifest V3-alternativ, och företag har fram till juni 2025 på sig att slutföra övergången med hjälp av policyn ExtensionManifestV2Availability.
  • Avvecklingsprocessen började den 3 juni 2024, och Chrome Web Store har inte accepterat nya Manifest V2-tillägg sedan juni 2022 för privata och januari 2022 för offentliga eller olistade tillägg.

Reaktioner

  • Chrome övergår från Manifest V2 till Manifest V3-tillägg, vilket påverkar annonsblockerare som uBlock Origin genom att begränsa deras kapacitet. Medan Chrome gör denna förändring, avser webbläsare som Firefox, Vivaldi och Brave att fortsätta stödja Manifest V2 för tillfället. Denna förändring har lett till diskussioner om användarkontroll och integritet, där vissa användare överväger att byta till alternativa webbläsare för att behålla effektiva annonsblockeringsfunktioner.

En Lisp-kompilator till RISC-V skriven i Lisp

  • uLisp är en version av programmeringsspråket Lisp designad för mikrokontroller, och stöder plattformar som Arduino, Raspberry Pi och ESP32. Det inkluderar funktioner som felsökning, SD-kortgränssnitt och I2C/SPI seriella gränssnitt, med exempel för applikationer som LED-blinkning och datalogging. En betydande funktion är Lisp-kompilatorn för RISC-V, som kompilerar Lisp-funktioner till maskinkod, och stöder rekursiva funktioner och optimering av svansanrop för förbättrad prestanda.

Reaktioner

  • En Lisp-kompilator för RISC-V, skriven i Lisp, är under utveckling men saknar vissa operationer och funktioner för att kunna kompilera sig själv. Kompilatorn stöder grundläggande Lisp-funktioner som car och cdr, men är ännu inte komplett. uLisp lyfts fram för sin enkelhet och lämplighet för mikrokontroller, med RISC-V som en attraktiv plattform för teknikentusiaster och hackare.

Nobels fredspris för 2024 tilldelas Nihon Hidankyo

  • 2024 års Nobels fredspris har tilldelats Nihon Hidankyo, en japansk organisation av överlevande från atombomben, kända som Hibakusha, för deras förespråkande av en kärnvapenfri värld. Hibakusha har betydligt bidragit till att etablera "kärnvapentabun", en global norm mot användningen av kärnvapen, genom sina kraftfulla vittnesmål. Denna erkänsla stämmer överens med Alfred Nobels vision om att hedra insatser som gynnar mänskligheten och fortsätter att inspirera nya generationer mot kärnvapennedrustning.

Reaktioner

  • 2024 års Nobels fredspris tilldelades Nihon Hidankyo, en japansk organisation som förespråkar mot kärnvapen, vilket understryker det bestående hotet från kärnvapen mitt i globala spänningar. Denna utmärkelse fungerar som en påminnelse om den förödande effekten av kärnvapenkrigföring, som exemplifieras av Hiroshima och Nagasaki, och betonar vikten av nedrustning. Prisdiskussionen involverar också komplexiteten i kärnvapenavskräckning, internationell rätt och de geopolitiska dynamikerna bland kärnvapenmakter.

Alternativ till WordPress

  • Artikeln har uppdaterats för att inkludera fler alternativ för Content Management System (CMS) på grund av ökat intresse, särskilt med tanke på den nuvarande situationen med WordPress. Listan innehåller nedladdningsbara CMS-alternativ som Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail och Textpattern, exklusive API- och git-baserade CMS. Noterbara omnämnanden inkluderar Ghost för sina inbyggda e-postfunktioner, Kirby för sin filbaserade metod och ClassicPress som en community-ledd WordPress-fork, medan vissa CMS som Anchor inte längre underhålls.

Reaktioner

  • Jekyll på GitHub Pages rekommenderas för enkla bloggar som använder Markdown, eftersom det erbjuder enkel användning utan att kräva lokal installation och möjliggör innehållsportabilitet över olika plattformar.
  • Alternativ till WordPress för bloggning inkluderar Chyrp Lite, Typecho, Quartz och Logseq, medan Drupal, ProcessWire och Wagtail erbjuder mer flexibilitet för utvecklare.
  • Statisk webbplatsgeneratorer som Astro och Publii blir alltmer populära, och för bildhosting föreslås alternativ som S3+Cloudfront eller CloudFlare.

Google Play tog bort mitt spel och vägrar berätta varför

  • Tukkun, en indie-spelutvecklare, har arbetat med "Anti-Idle: Reborn," som godkändes av Google och Apple, och har varit i stängd beta i en månad. Den 7 oktober 2024 avslutade Google Tukkuns konto med hänvisning till "tidigare överträdelser" och "högriskbeteende," men gav ingen tydlig förklaring, vilket påverkade hans arbete och inkomst. Denna situation belyser ett bredare problem där utvecklare upplever vaga kontoterminationer, vilket leder till krav på mer transparens och tydlighet från plattformar som Google.

Reaktioner

  • Google Play tog bort en utvecklares spel utan förklaring, vilket understryker den betydande kontroll som teknikföretag har över utvecklare.
  • Liknande incidenter har rapporterats med Amazon och Google, där konton eller appar förbjuds utan tydliga skäl eller tillräckligt stöd.
  • Utvecklare uppmanas att diversifiera sina plattformar för att minska riskerna, eftersom denna situation belyser bredare oro över teknikjättarnas kundservice och beroenderiskerna med att bygga företag på deras plattformar.

Nurdle Patrol

Reaktioner

  • I 2023 förlorades 221 fraktcontainrar till havs, ett litet antal jämfört med de 250 miljoner som skeppas årligen, vilket belyser omfattningen av den globala sjöfartsverksamheten.
  • Plastpellets, kända som nurdles, är synliga föroreningar på stränder och kan brytas ner till mikroplaster, vilket gör att de kommer in i näringskedjan och kan utgöra potentiell skada, även om de inte är den primära källan till marin plastförorening.
  • Diskussionen om plastföroreningar betonar dess komplexitet och globala påverkan, inklusive exporten av avfallsproblem från utvecklade till utvecklingsländer och den potentiella anpassningen av ekosystem till plastföroreningar, vilket väcker oro över framtida plastanvändning.

Initiala CUDA-prestandalektioner

  • Malte Skarupke diskuterar sin erfarenhet av att lära sig CUDA och noterar att det i huvudsak är C++ med ytterligare funktioner för parallell databehandling.
  • Viktiga lärdomar för att optimera CUDA-prestanda inkluderar minneskoalescering, förståelse för olika minnestyper och att maximera parallellism genom att använda många trådar och dela upp uppgifter i olika kärnor.
  • Skarupke betonar att skriva CUDA liknar att lösa ett pussel, där det primära fokuset bör ligga på att köra uppgifter parallellt innan man optimerar för hastighet.

Reaktioner

  • Diskussionen fokuserar på att optimera CUDA-kod för GPU-prestanda, specifikt för en LHC (Large Hadron Collider) experimentutlösare, genom att hantera register, delat minne och trådblock.
  • Det betonar avvägningarna mellan beläggning (antalet aktiva trådar), registeranvändning och minneslatens, och lyfter fram utvecklingen av programmeringsbegränsningar i CUDA.
  • Konversationen jämför GPU- och CPU-prestanda, noterar skillnader i strömförbrukning och beräkningskapacitet, och betonar vikten av att balansera beläggning och prestanda för framtida hårdvaru- och mjukvaruframsteg.

FBI skapade ett mynt för att utreda kryptovaluta pump-and-dump-scheman

  • FBI utvecklade en Ethereum-baserad kryptovaluta, NexFundAI, för att undersöka och avslöja kryptovaluta pump-and-dump-scheman, vilket ledde till betydande rättsliga åtgärder. Åtal väcktes mot 18 individer och enheter för bedrägeri och marknadsmanipulation, där Securities and Exchange Commission riktade in sig på tre marknadsgaranter och nio andra för att ha blåst upp priserna på kryptotillgångar. Justitiedepartementet återvann framgångsrikt 25 miljoner dollar i bedrägliga intäkter, som kommer att återlämnas till investerare, vilket understryker operationens effektivitet i att bekämpa kryptobedrägerier.

Reaktioner

  • FBI utvecklade en kryptovaluta för att undersöka pump-and-dump-scheman, vilket är bedrägliga metoder som konstgjort höjer priset på en tillgång innan den säljs av.
  • Detta initiativ har väckt debatter om provokation och de etiska konsekvenserna av att brottsbekämpande myndigheter skapar förfalskade värdepapper.
  • Diskussionen sträcker sig till bredare frågor om legitimiteten hos kryptovalutor och regeringens roll i att reglera digitala valutor.

NotesHub: plattformsoberoende, Markdown-baserad anteckningsapp

  • Appen är tillgänglig på flera plattformar, inklusive iOS, Android, Windows, Mac, Apple Vision Pro och webben, där webbversionen är en gratis progressiv webbapp som fungerar offline. - Anteckningar kan lagras i Git-repositorier, med bästa integrationen med GitHub, och stödjer även självhostade alternativ som Gitea, filsystem eller iCloud Drive. - Appen stödjer rik Markdown-syntax med tillägg för att skapa Kanban-tavlor, Excalidraw-baserade whiteboards, och inkluderar funktioner som Mermaid och ABC-musiknotation.

Reaktioner

  • NotesHub är en mångsidig, Markdown-baserad anteckningsapp som finns tillgänglig på flera plattformar, inklusive iOS, Android, Windows, Mac, Apple Vision Pro och webben. Appen erbjuder en gratis progressiv webbappversion, medan de inhemska versionerna kräver en engångsbetalning, med stark integration för att lagra anteckningar i Git-repositorier som GitHub, GitLab eller Bitbucket. Den har rik Markdown-syntax, Kanban-tavlor och Excalidraw-baserade whiteboards, med användare som berömmer dess rena design och offline-funktioner, även om den inte är öppen källkod och har begränsat Linux-stöd.

Dead man's switch utan beroende av din infrastruktur

  • Ett nytt Go-projekt, Deadcheck, har utvecklats för att fungera som en död mans brytare utan att förlita sig på cron-jobb, timers eller databaser. Deadcheck integreras med PagerDuty, en populär plattform för incidenthantering, för att hålla incidenter vilande tills en incheckning missas, vid vilken tidpunkt det utlöser en varning. Detta projekt är anmärkningsvärt för sitt innovativa sätt att hantera varningar och incidenter utan traditionella schemaläggnings- eller databaserberoenden.

Reaktioner

  • Deadcheck är ett Go-projekt utformat som en död mans brytare, vilket eliminerar behovet av cron-jobb eller databaser, och integreras med PagerDuty för att hantera larm.
  • Projektet har väckt diskussioner om dödmansgrepp, inklusive juridiska aspekter och alternativa lösningar som att använda advokater eller blockkedjesystem.
  • Användare har föreslagit befintliga tjänster som Cronitor eller OpsGenie för liknande funktioner, och projektet planerar att utöka integrationer bortom PagerDuty.

Förståelse för begränsningarna av matematisk resonemang i stora språkmodeller

  • Artikeln "GSM-Symbolic" av Iman Mirzadeh et al. undersöker de matematiska resonemangsförmågorna hos stora språkmodeller (LLMs) med hjälp av GSM8K-benchmarken. Författarna introducerar GSM-Symbolic, en ny benchmark med symboliska mallar, som visar att LLMs har svårt med variationer i numeriska värden och ytterligare klausuler i frågor. Studien antyder att LLMs kan replikera resonemang från träningsdata snarare än att utföra genuint logiskt resonemang, vilket belyser deras begränsningar i matematiskt resonemang.

Reaktioner

  • Stora språkmodeller (LLMs) står inför utmaningar inom matematisk resonemang, särskilt när problem innehåller irrelevant information, vilket påverkar deras prestanda. Denna begränsning understryker LLMs beroende av mönsterigenkänning snarare än logiskt resonemang, vilket gör dem mindre effektiva i verkliga scenarier med överflödiga detaljer. Trots framsteg har LLMs fortfarande svårt att skilja viktig information från brus, en kritisk färdighet som behövs för praktiska tillämpningar.

ARIA: En öppen multimodal inbyggd expertblandningsmodell

  • Aria är en öppen multimodal inhemsk AI-modell som integrerar mångsidig information från verkligheten för en omfattande förståelse, och överträffar modeller som Pixtral-12B och Llama3.2-11B i prestanda. Det är en mixture-of-expert-modell med 3,9 miljarder och 3,5 miljarder aktiverade parametrar per visuellt och textuellt token, vilket förbättrar dess språk- och multimodala kapaciteter. Modellens vikter och kodbas är öppen källkod, vilket underlättar enkel adoption och anpassning av utvecklare och forskare.

Reaktioner

  • ARIA är en ny multimodal inbyggd Mixture-of-Experts (MoE) modell som överträffar Pixtral-12B och Llama3.2-11B i prestanda och inferenshastighet genom att effektivt utnyttja aktiva parametrar. Trots att den har en minnesanvändning som liknar en 25B-modell, presterar ARIA som en 10B-modell och fungerar lika snabbt som en 4B-modell, vilket gör den lämplig för enheter med tillräckligt minne, såsom en M2 Max. Modellens experter fokuserar på syntax, med utrymme för förbättring i expertval, och den är för närvarande tillgänglig för testning, även om vissa användare har stött på plattformsproblem.