Skip to main content

2024-10-11

„2 doláre za H100: Ako praskla bublina prenájmu GPU“

  • „Trh s GPU zaznamenal výrazný pokles cien, pričom ceny H100 GPU klesli z 8 USD/hod na menej ako 2 USD/hod v dôsledku nadmernej ponuky a zmeny dynamiky dopytu. Faktory prispievajúce k tomuto posunu zahŕňajú predaj rezervovaných výpočtových kapacít, doladenie otvorených modelov a zníženie počtu nových spoločností zameraných na základné modely, čo robí prenájom GPU výhodnejším ako ich nákup. Vznik modelov s otvorenou váhou a cenovo dostupnejších alternatív, ako sú GPU od AMD a Intelu, ovplyvňuje trh, pričom rastie dôraz na AI inferenciu a doladenie, podporované platformami ako Featherless.AI, ktoré ponúkajú nákladovo efektívne AI riešenia.“

Reakcie

  • „Trh s prenájmom GPU zaznamenal dramatický pokles cien pre H100 GPU, z 8 USD/hod na 2 USD/hod, v dôsledku nadmernej ponuky a zníženého dopytu zo strany nových spoločností s modelmi základov.“
  • „Toto zníženie cien prasklo bublinu prenájmu GPU, čo ovplyvnilo investorov, ktorí výrazne investovali do infraštruktúry GPU.“
  • „Článok skúma potenciál pre prístupnejšiu krajinu umelej inteligencie s lacnejšími možnosťami výpočtov, hoci dlhodobá udržateľnosť týchto nízkych cien a budúcnosť infraštruktúry umelej inteligencie sú neisté.“

„Tesla Robotaxi“

Reakcie

  • „Tesla nedávno predstavila svoj Robotaxi, zdôrazňujúc víziu autonómnych taxíkov, ktorá kontrastuje s prístupom Waymo, ktoré používa nákladný hardvér ako LiDAR. Dizajn Robotaxi, ktorý postráda volant, naznačuje budúcnosť závislú na plnej autonómii, hoci čelí regulačným a technologickým výzvam. Technológia Tesla Full Self-Driving (FSD) je predmetom diskusie, pričom kritici spochybňujú jej pripravenosť na nepretržité riadenie a podporovatelia sú optimistickí ohľadom jej potenciálu.“

„Začnite deaktivovať nainštalované rozšírenia, ktoré stále používajú Manifest V2 v stabilnej verzii Chrome.“

  • „Google postupne ukončuje podporu Manifest V2 pre rozšírenia Chrome, pričom varovania a deaktivácia týchto rozšírení začínajú na predstabilných kanáloch od 9. októbra 2024.“
  • „Používatelia sú vyzývaní, aby prešli na alternatívy Manifest V3, pričom podniky majú čas do júna 2025 na dokončenie prechodu pomocou politiky ExtensionManifestV2Availability.“
  • „Proces postupného ukončovania začal 3. júna 2024 a Chrome Web Store neakceptuje nové rozšírenia Manifest V2 od júna 2022 pre súkromné a od januára 2022 pre verejné alebo nezaradené rozšírenia.“

Reakcie

  • „Chrome prechádza z rozšírení Manifest V2 na Manifest V3, čo ovplyvňuje blokátory reklám ako uBlock Origin tým, že obmedzuje ich schopnosti. Zatiaľ čo Chrome robí tento posun, prehliadače ako Firefox, Vivaldi a Brave plánujú naďalej podporovať Manifest V2 zatiaľ. Táto zmena vyvolala diskusie o kontrole používateľov a súkromí, pričom niektorí používatelia zvažujú prechod na alternatívne prehliadače, aby si zachovali efektívne funkcie blokovania reklám.“

„Kompilátor Lisp do RISC-V napísaný v Lispe“

  • „uLisp je verzia programovacieho jazyka Lisp navrhnutá pre mikrokontroléry, podporujúca platformy ako Arduino, Raspberry Pi a ESP32. Zahŕňa funkcie ako ladenie, rozhranie SD karty a sériové rozhrania I2C/SPI, s príkladmi pre aplikácie ako blikanie LED a zaznamenávanie údajov. Významnou funkciou je Lisp kompilátor pre RISC-V, ktorý kompiluje Lisp funkcie do strojového kódu, podporujúc rekurzívne funkcie a optimalizáciu koncových volaní pre zlepšený výkon.“

Reakcie

  • „Kompilátor Lisp pre RISC-V, napísaný v Lispe, je vo vývoji, ale chýbajú mu určité operácie a funkcie, aby bol schopný samokompilácie. Kompilátor podporuje základné funkcie Lisp ako car a cdr, ale ešte nie je dokončený. uLisp je vyzdvihovaný pre svoju jednoduchosť a vhodnosť pre mikrokontroléry, pričom RISC-V je atraktívnou platformou pre technologických nadšencov a hackerov.“

„Nobelova cena za mier za rok 2024 bola udelená organizácii Nihon Hidankyo“

  • „Nobelova cena za mier za rok 2024 bola udelená japonskej organizácii Nihon Hidankyo, ktorá združuje preživších atómových bômb, známych ako Hibakusha, za ich advokáciu za svet bez jadrových zbraní. Hibakusha významne prispeli k vytvoreniu „jadrového tabu“, globálnej normy proti používaniu jadrových zbraní, prostredníctvom svojich pôsobivých svedectiev. Toto uznanie je v súlade s víziou Alfreda Nobela o oceňovaní úsilia, ktoré prospieva ľudstvu, a naďalej inšpiruje nové generácie k jadrovému odzbrojeniu.“

Reakcie

  • „Nobelova cena za mier za rok 2024 bola udelená japonskej organizácii Nihon Hidankyo, ktorá sa zasadzovala proti jadrovým zbraniam, čím poukázala na pretrvávajúcu hrozbu jadrových zbraní uprostred globálnych napätí. Táto cena slúži ako pripomienka ničivého dopadu jadrovej vojny, ako to ukazujú Hirošima a Nagasaki, a zdôrazňuje dôležitosť odzbrojenia. Diskusia o cene zahŕňa aj zložitosť jadrového odstrašovania, medzinárodného práva a geopolitickej dynamiky medzi jadrovými mocnosťami.“

„Alternatívy k WordPress“

  • „Článok bol aktualizovaný, aby zahŕňal viac alternatív systémov na správu obsahu (CMS) v dôsledku zvýšeného záujmu, najmä v súvislosti so súčasnou situáciou okolo WordPressu. Zoznam obsahuje stiahnuteľné možnosti CMS ako Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail a Textpattern, pričom vylučuje CMS založené na API a git. Medzi pozoruhodné zmienky patrí Ghost pre svoje zabudované e-mailové funkcie, Kirby pre svoj prístup založený na súboroch a ClassicPress ako komunitou vedená odnož WordPressu, zatiaľ čo niektoré CMS ako Anchor už nie sú udržiavané.“

Reakcie

  • „Jekyll na GitHub Pages sa odporúča pre jednoduché blogy používajúce Markdown, ponúkajúci jednoduché použitie bez nutnosti lokálneho nastavenia a umožňujúci prenosnosť obsahu medzi platformami.“
  • „Alternatívy k WordPressu pre blogovanie zahŕňajú Chyrp Lite, Typecho, Quartz a Logseq, zatiaľ čo Drupal, ProcessWire a Wagtail poskytujú väčšiu flexibilitu pre vývojárov.“
  • „Statické generátory stránok ako Astro a Publii sa stávajú čoraz populárnejšími a pre hosťovanie obrázkov sa odporúčajú možnosti ako S3+Cloudfront alebo CloudFlare.“

„Google Play zrušil moju hru a nechce mi povedať prečo“

  • „Tukkun, nezávislý vývojár hier, pracuje na hre "Anti-Idle: Reborn," ktorá bola schválená spoločnosťami Google a Apple a bola v uzavretej beta verzii mesiac. Dňa 7. októbra 2024 Google zrušil Tukkunov účet s odvolaním sa na "predchádzajúce porušenia" a "vysokorizikové správanie," ale neposkytol jasné vysvetlenie, čo ovplyvnilo jeho prácu a príjem. Táto situácia poukazuje na širší problém, kde vývojári zažívajú nejasné zrušenia účtov, čo vyvoláva výzvy na väčšiu transparentnosť a jasnosť zo strany platforiem ako Google.“

Reakcie

  • „Google Play odstránil hru vývojára bez vysvetlenia, čo zdôrazňuje významnú kontrolu, ktorú majú technologické spoločnosti nad vývojármi.“
  • „Podobné incidenty boli hlásené aj s Amazonom a Googlom, kde sú účty alebo aplikácie zakázané bez jasných dôvodov alebo primeranej podpory.“
  • „Vývojári sú povzbudzovaní, aby diverzifikovali svoje platformy na zmiernenie rizík, pretože táto situácia poukazuje na širšie obavy o zákaznícky servis technologických gigantov a riziká závislosti pri budovaní podnikania na ich platformách.“

„Hliadka Nurdle“

Reakcie

  • „V roku 2023 sa na mori stratilo 221 prepravných kontajnerov, čo je malý počet v porovnaní s 250 miliónmi, ktoré sa ročne prepravujú, čo poukazuje na rozsah globálnych prepravných operácií.“
  • „Plastové pelety, známe ako nurdles, sú viditeľnými znečisťovateľmi na plážach a môžu sa rozkladať na mikroplasty, ktoré vstupujú do potravinového reťazca a predstavujú potenciálne nebezpečenstvo, hoci nie sú hlavným zdrojom plastového znečistenia morí.“
  • „Diskusia o znečistení plastmi zdôrazňuje jeho zložitosť a globálny dopad, vrátane exportu odpadových problémov z rozvinutých do rozvojových krajín a potenciálnej adaptácie ekosystémov na znečistenie plastmi, čo vyvoláva obavy o budúce používanie plastov.“

„Úvodné lekcie výkonu CUDA“

  • „Malte Skarupke hovorí o svojej skúsenosti s učením sa CUDA, pričom poznamenáva, že je to v podstate C++ s ďalšími funkciami pre paralelné výpočty.“
  • „Kľúčové lekcie pre optimalizáciu výkonu CUDA zahŕňajú zlučovanie pamäte, porozumenie rôznym typom pamäte a maximalizáciu paralelizmu použitím mnohých vlákien a rozdelením úloh do rôznych jadier.“
  • „Skarupke zdôrazňuje, že písanie CUDA je podobné riešeniu hlavolamu, kde by sa primárna pozornosť mala sústrediť na spúšťanie úloh paralelne pred optimalizáciou pre rýchlosť.“

Reakcie

  • „Diskusia sa zameriava na optimalizáciu CUDA kódu pre výkon GPU, konkrétne pre spúšťač experimentu LHC (Veľký hadrónový urýchľovač), riadením registrov, zdieľanej pamäte a blokov vlákien.“
  • „Zdôrazňuje kompromisy medzi obsadenosťou (počet aktívnych vlákien), využitím registrov a latenciami pamäte, pričom poukazuje na vývoj programovacích obmedzení v CUDA.“
  • „Rozhovor porovnáva výkon GPU a CPU, poukazuje na rozdiely v spotrebe energie a výpočtových schopnostiach a zdôrazňuje dôležitosť vyváženia obsadenosti a výkonu pre budúce pokroky v hardvéri a softvéri.“

„FBI vytvorila mincu na vyšetrovanie kryptomenových pump-and-dump schém“

  • „FBI vyvinula kryptomenu založenú na Ethereu, NexFundAI, na vyšetrovanie a odhalenie schém pump-and-dump v kryptomenách, čo viedlo k významným právnym krokom. Boli vznesené obvinenia proti 18 jednotlivcom a subjektom za podvod a manipuláciu s trhom, pričom Komisia pre cenné papiere a burzy sa zamerala na troch tvorcov trhu a deväť ďalších za nafukovanie cien krypto aktív. Ministerstvo spravodlivosti úspešne získalo späť 25 miliónov dolárov z podvodných výnosov, ktoré budú vrátené investorom, čo zdôrazňuje efektívnosť operácie v boji proti podvodom v kryptomenách.“

Reakcie

  • „FBI vyvinula kryptomenu na vyšetrovanie schém pump-and-dump, čo sú podvodné praktiky, ktoré umelo zvyšujú cenu aktíva pred jeho predajom.“
  • „Táto iniciatíva vyvolala diskusie o provokácii a etických dôsledkoch toho, že orgány činné v trestnom konaní vytvárajú falošné cenné papiere.“
  • „Diskusia sa rozširuje na širšie obavy o legitimitu kryptomien a úlohu vlády v regulácii digitálnych mien.“

„NotesHub: multiplatformová aplikácia na písanie poznámok založená na Markdown“

  • „Aplikácia je dostupná na viacerých platformách, vrátane iOS, Android, Windows, Mac, Apple Vision Pro a Webu, pričom webová verzia je bezplatná progresívna webová aplikácia, ktorá funguje offline. Poznámky môžu byť uložené v Git repozitároch, s najlepšou integráciou s GitHubom, a tiež podporujú možnosti vlastného hostingu ako Gitea, súborové systémy alebo iCloud Drive. Aplikácia podporuje bohatú syntax Markdown s rozšíreniami na vytváranie Kanban tabúľ, bielych tabúľ založených na Excalidraw a zahŕňa funkcie ako Mermaid a ABC notácia hudby.“

Reakcie

  • „NotesHub je všestranná aplikácia na písanie poznámok založená na Markdown, dostupná na viacerých platformách vrátane iOS, Android, Windows, Mac, Apple Vision Pro a webu. Aplikácia ponúka bezplatnú verziu Progressive Web App, zatiaľ čo natívne verzie vyžadujú jednorazovú platbu, s pevnou integráciou na ukladanie poznámok v Git repozitároch ako GitHub, GitLab alebo Bitbucket. Obsahuje bohatú syntax Markdown, Kanban dosky a biele tabule založené na Excalidraw, pričom používatelia chvália jej čistý dizajn a offline schopnosti, aj keď nie je open-source a má obmedzenú podporu pre Linux.“

„Mŕtvy mužov spínač bez závislosti na vašej infraštruktúre“

  • „Nový projekt v jazyku Go, Deadcheck, bol vyvinutý na fungovanie ako mŕtvy mužov spínač bez spoliehania sa na cron úlohy, časovače alebo databázy. Deadcheck sa integruje s PagerDuty, populárnou platformou na riadenie incidentov, aby udržiaval incidenty v stave odloženia, kým sa nevynechá kontrola, v tom momente spustí upozornenie. Tento projekt je pozoruhodný svojím inovatívnym prístupom k riadeniu upozornení a incidentov bez tradičného plánovania alebo závislostí na databázach.“

Reakcie

  • „Deadcheck je projekt v jazyku Go navrhnutý ako spínač mŕtveho muža, ktorý eliminuje potrebu cron úloh alebo databáz a integruje sa s PagerDuty na správu upozornení.“
  • „Projekt vyvolal diskusie o mŕtvych mužských spínačoch, vrátane právnych aspektov a alternatívnych riešení, ako je využívanie právnikov alebo blockchainových systémov.“
  • „Používatelia navrhli existujúce služby ako Cronitor alebo OpsGenie pre podobné funkcie a projekt plánuje rozšíriť integrácie aj mimo PagerDuty.“

„Pochopenie obmedzení matematického uvažovania vo veľkých jazykových modeloch“

  • „Práca „GSM-Symbolic“ od Iman Mirzadeh a kol. skúma schopnosti matematického uvažovania veľkých jazykových modelov (LLM) pomocou benchmarku GSM8K. Autori predstavujú GSM-Symbolic, nový benchmark so symbolickými šablónami, ktorý ukazuje, že LLM majú problémy s variáciami v číselných hodnotách a dodatočnými klauzulami v otázkach. Štúdia naznačuje, že LLM môžu replikovať uvažovanie z tréningových dát namiesto skutočného logického uvažovania, čím poukazuje na ich obmedzenia v matematickom uvažovaní.“

Reakcie

  • „Veľké jazykové modely (LLMs) čelia výzvam v matematickom uvažovaní, najmä keď problémy obsahujú irelevantné informácie, čo ovplyvňuje ich výkon. Táto obmedzenosť zdôrazňuje závislosť LLMs na rozpoznávaní vzorov namiesto logického uvažovania, čo ich robí menej efektívnymi v reálnych situáciách s nadbytočnými detailmi. Napriek pokrokom LLMs stále zápasia s rozlišovaním dôležitých informácií od šumu, čo je kritická zručnosť potrebná pre praktické aplikácie.“

„ARIA: Otvorený multimodálny natívny model zmesi expertov“

  • „Aria je otvorený multimodálny natívny AI model, ktorý integruje rôznorodé informácie z reálneho sveta pre komplexné porozumenie, prekonávajúc modely ako Pixtral-12B a Llama3.2-11B vo výkone. Je to model zložený z expertov s 3,9 miliardami a 3,5 miliardami aktivovaných parametrov na vizuálny a textový token, čím zlepšuje svoje jazykové a multimodálne schopnosti. Váhy modelu a základný kód sú otvorené, čo uľahčuje ich prijatie a prispôsobenie vývojármi a výskumníkmi.“

Reakcie

  • „ARIA je nový multimodálny natívny model Mixture-of-Experts (MoE), ktorý prekonáva Pixtral-12B a Llama3.2-11B v oblasti výkonu a rýchlosti inferencie efektívnym využívaním aktívnych parametrov. Napriek tomu, že má pamäťovú náročnosť podobnú modelu 25B, ARIA funguje ako model 10B a pracuje tak rýchlo ako model 4B, čo ho robí vhodným pre zariadenia s dostatočnou pamäťou, ako je M2 Max. Experti modelu sa zameriavajú na syntax, pričom je priestor na zlepšenie vo výbere expertov, a je momentálne dostupný na testovanie, hoci niektorí používatelia narazili na problémy s platformou.“