Przejdź do głównej zawartości

2024-10-11

„2 dolary za H100: Jak pękła bańka wynajmu GPU”

  • „Rynek GPU doświadczył znaczącego spadku cen, z GPU H100 taniejącymi z 8 USD/godz. do poniżej 2 USD/godz. z powodu nadpodaży i zmieniającej się dynamiki popytu. Czynniki przyczyniające się do tej zmiany obejmują odsprzedaż zarezerwowanej mocy obliczeniowej, dostrajanie otwartych modeli oraz zmniejszenie liczby nowych firm zajmujących się modelami bazowymi, co sprawia, że wynajem GPU jest bardziej korzystny niż ich zakup. Pojawienie się modeli z otwartymi wagami i bardziej przystępnych cenowo alternatyw, takich jak GPU AMD i Intel, wpływa na rynek, z rosnącym naciskiem na wnioskowanie AI i dostrajanie, wspierane przez platformy takie jak Featherless.AI oferujące opłacalne rozwiązania AI.”

Reakcje

  • „Rynek wynajmu GPU doświadczył dramatycznego spadku cen dla GPU H100, z 8 USD/godz. do 2 USD/godz., z powodu nadpodaży i zmniejszonego popytu ze strony nowych firm zajmujących się modelami bazowymi.”
  • „Ta obniżka cen spowodowała pęknięcie bańki wynajmu GPU, wpływając na inwestorów, którzy mocno zainwestowali w infrastrukturę GPU.”
  • „Artykuł bada potencjał bardziej dostępnego krajobrazu AI dzięki tańszym opcjom obliczeniowym, choć długoterminowa trwałość tych niskich cen i przyszłość infrastruktury AI są niepewne.”

„Robotaxi Tesli”

Reakcje

  • „Tesla niedawno zaprezentowała swój Robotaxi, podkreślając wizję autonomicznych taksówek, która kontrastuje z podejściem Waymo, wykorzystującym kosztowne urządzenia, takie jak LiDAR. Projekt Robotaxi, pozbawiony kierownicy, wskazuje na przyszłość opartą na pełnej autonomii, choć napotyka na wyzwania regulacyjne i technologiczne. Technologia Full Self-Driving (FSD) Tesli jest przedmiotem debaty, z krytykami kwestionującymi jej gotowość do jazdy bez nadzoru i zwolennikami optymistycznie oceniającymi jej potencjał.”

„Rozpocznij wyłączanie zainstalowanych rozszerzeń nadal używających Manifestu V2 w stabilnej wersji Chrome”

  • „Google wycofuje Manifest V2 dla rozszerzeń Chrome, z ostrzeżeniami i wyłączaniem tych rozszerzeń na kanałach przed stabilnymi, począwszy od 9 października 2024 roku.”
  • „Zachęca się użytkowników do przejścia na alternatywy Manifest V3, przy czym przedsiębiorstwa mają czas do czerwca 2025 roku na zakończenie tego procesu, korzystając z polityki ExtensionManifestV2Availability.”
  • „Proces wycofywania rozpoczął się 3 czerwca 2024 roku, a Chrome Web Store nie akceptuje nowych rozszerzeń Manifest V2 od czerwca 2022 roku dla prywatnych oraz od stycznia 2022 roku dla publicznych lub niepublicznych rozszerzeń.”

Reakcje

  • „Chrome przechodzi z rozszerzeń Manifest V2 na Manifest V3, co wpływa na blokery reklam, takie jak uBlock Origin, ograniczając ich możliwości. Podczas gdy Chrome dokonuje tej zmiany, przeglądarki takie jak Firefox, Vivaldi i Brave zamierzają nadal wspierać Manifest V2 na razie. Ta zmiana wywołała dyskusje na temat kontroli użytkownika i prywatności, a niektórzy użytkownicy rozważają przejście na alternatywne przeglądarki, aby zachować skuteczne funkcje blokowania reklam.”

„Kompilator Lisp do RISC-V napisany w Lisp”

  • „uLisp to wersja języka programowania Lisp zaprojektowana dla mikrokontrolerów, obsługująca platformy takie jak Arduino, Raspberry Pi i ESP32. Zawiera funkcje takie jak debugowanie, interfejs karty SD oraz interfejsy szeregowe I2C/SPI, z przykładami zastosowań, takich jak miganie diod LED i rejestrowanie danych. Istotną cechą jest kompilator Lisp dla RISC-V, który kompiluje funkcje Lisp do kodu maszynowego, wspierając funkcje rekurencyjne i optymalizację wywołań ogonowych dla lepszej wydajności.”

Reakcje

  • „Kompilator Lisp dla RISC-V, napisany w Lisp, jest w trakcie rozwoju, ale brakuje mu pewnych operacji i funkcji, aby mógł się sam kompilować. Kompilator obsługuje podstawowe funkcje Lisp, takie jak car i cdr, ale nie jest jeszcze kompletny. uLisp jest wyróżniany za swoją prostotę i przydatność dla mikrokontrolerów, a RISC-V jest atrakcyjną platformą dla entuzjastów technologii i hakerów.”

„Pokojowa Nagroda Nobla za 2024 rok przyznana Nihon Hidankyo”

  • „Pokojowa Nagroda Nobla 2024 została przyznana Nihon Hidankyo, japońskiej organizacji ocalałych z ataków atomowych, znanych jako Hibakusha, za ich działania na rzecz świata wolnego od broni nuklearnej. Hibakusha znacząco przyczynili się do ustanowienia „nuklearnego tabu”, globalnej normy przeciwko użyciu broni jądrowej, poprzez swoje poruszające świadectwa. To uznanie jest zgodne z wizją Alfreda Nobla, aby honorować wysiłki przynoszące korzyści ludzkości i nadal inspiruje nowe pokolenia do rozbrojenia nuklearnego.”

Reakcje

  • „Pokojowa Nagroda Nobla 2024 została przyznana Nihon Hidankyo, japońskiej organizacji działającej na rzecz przeciwdziałania broni jądrowej, podkreślając ciągłe zagrożenie związane z bronią nuklearną w obliczu globalnych napięć. Ta nagroda przypomina o niszczycielskim wpływie wojny nuklearnej, czego przykładem są Hiroszima i Nagasaki, oraz podkreśla znaczenie rozbrojenia. Dyskusja na temat nagrody obejmuje również złożoność odstraszania nuklearnego, prawa międzynarodowego i dynamiki geopolitycznej wśród mocarstw nuklearnych.”

„Alternatywy dla WordPress”

  • „Artykuł został zaktualizowany, aby uwzględnić więcej alternatyw dla systemów zarządzania treścią (CMS) z powodu rosnącego zainteresowania, szczególnie w kontekście obecnej sytuacji z WordPress. Lista zawiera opcje CMS do pobrania, takie jak Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail i Textpattern, z wyłączeniem CMS-ów opartych na API i git. Warto wspomnieć o Ghost ze względu na wbudowane funkcje e-mail, Kirby za podejście oparte na plikach oraz ClassicPress jako społecznościowy fork WordPress, podczas gdy niektóre CMS-y, takie jak Anchor, nie są już utrzymywane.”

Reakcje

  • „Jekyll na GitHub Pages jest zalecany dla prostych blogów używających Markdown, oferując łatwość użytkowania bez konieczności lokalnej konfiguracji i umożliwiając przenośność treści między platformami.”
  • „Alternatywy dla WordPressa do blogowania to Chyrp Lite, Typecho, Quartz i Logseq, podczas gdy Drupal, ProcessWire i Wagtail oferują większą elastyczność dla deweloperów.”
  • „Generatory statycznych stron, takie jak Astro i Publii, stają się coraz bardziej popularne, a do hostingu obrazów sugerowane są opcje takie jak S3+Cloudfront lub CloudFlare.”

„Google Play usunęło moją grę i nie chce mi powiedzieć dlaczego”

  • „Tukkun, niezależny twórca gier, pracuje nad "Anti-Idle: Reborn", która została zatwierdzona przez Google i Apple, i była w fazie zamkniętej bety przez miesiąc. 7 października 2024 roku Google zakończyło konto Tukkuna, powołując się na "wcześniejsze naruszenia" i "wysokie ryzyko zachowania", ale nie dostarczyło jasnego wyjaśnienia, co wpłynęło na jego pracę i dochody. Ta sytuacja podkreśla szerszy problem, w którym deweloperzy doświadczają niejasnych zakończeń kont, co skłania do wezwania do większej przejrzystości i jasności ze strony platform takich jak Google.”

Reakcje

  • „Google Play usunęło grę dewelopera bez wyjaśnienia, co podkreśla znaczną kontrolę, jaką firmy technologiczne mają nad deweloperami.”
  • „Podobne incydenty zgłaszano w przypadku Amazon i Google, gdzie konta lub aplikacje są blokowane bez jasnych powodów lub odpowiedniego wsparcia.”
  • „Zachęca się deweloperów do dywersyfikacji swoich platform w celu zminimalizowania ryzyka, ponieważ ta sytuacja podkreśla szersze obawy dotyczące obsługi klienta przez gigantów technologicznych oraz ryzyka związanego z budowaniem biznesów na ich platformach.”

„Patrol Nurdli”

Reakcje

  • „W 2023 roku na morzu zaginęło 221 kontenerów, co stanowi niewielką liczbę w porównaniu do 250 milionów wysyłanych rocznie, co podkreśla skalę globalnych operacji żeglugowych.”
  • „Granulki plastikowe, znane jako nurdle, są widocznymi zanieczyszczeniami na plażach i mogą rozkładać się na mikroplastiki, wchodząc do łańcucha pokarmowego i stanowiąc potencjalne zagrożenie, choć nie są głównym źródłem zanieczyszczenia plastikiem w morzach.”
  • „Dyskusja na temat zanieczyszczenia plastikiem podkreśla jego złożoność i globalny wpływ, w tym eksport odpadów z krajów rozwiniętych do rozwijających się oraz potencjalną adaptację ekosystemów do zanieczyszczenia plastikiem, co budzi obawy dotyczące przyszłego użycia plastiku.”

„Początkowe lekcje wydajności CUDA”

  • „Malte Skarupke omawia swoje doświadczenia z nauką CUDA, zauważając, że jest to w zasadzie C++ z dodatkowymi funkcjami do obliczeń równoległych.”
  • „Kluczowe lekcje optymalizacji wydajności CUDA obejmują koalescencję pamięci, zrozumienie różnych typów pamięci oraz maksymalizację równoległości poprzez użycie wielu wątków i rozdzielenie zadań na różne jądra.”
  • „Skarupke podkreśla, że pisanie CUDA jest podobne do rozwiązywania łamigłówki, gdzie głównym celem powinno być uruchamianie zadań równolegle, zanim zacznie się optymalizować pod kątem szybkości.”

Reakcje

  • „Dyskusja koncentruje się na optymalizacji kodu CUDA pod kątem wydajności GPU, szczególnie dla wyzwalacza eksperymentu LHC (Wielki Zderzacz Hadronów), poprzez zarządzanie rejestrami, pamięcią współdzieloną i blokami wątków.”
  • „Podkreśla kompromisy między zajętością (liczbą aktywnych wątków), użyciem rejestrów a opóźnieniami pamięci, uwydatniając ewolucję ograniczeń programistycznych w CUDA.”
  • „Rozmowa porównuje wydajność GPU i CPU, zwracając uwagę na różnice w zużyciu energii i zdolnościach obliczeniowych, oraz podkreśla znaczenie równoważenia obciążenia i wydajności dla przyszłych postępów w sprzęcie i oprogramowaniu.”

„FBI stworzyło monetę do badania schematów pompowania i zrzucania kryptowalut”

  • „FBI opracowało kryptowalutę opartą na Ethereum, NexFundAI, w celu badania i ujawniania schematów pompowania i zrzucania kryptowalut, co doprowadziło do znaczących działań prawnych. Postawiono zarzuty przeciwko 18 osobom i podmiotom za oszustwa i manipulacje rynkowe, a Komisja Papierów Wartościowych i Giełd skierowała działania przeciwko trzem twórcom rynku i dziewięciu innym za zawyżanie cen aktywów kryptowalutowych. Departament Sprawiedliwości z powodzeniem odzyskał 25 milionów dolarów z nielegalnych dochodów, które zostaną zwrócone inwestorom, co podkreśla skuteczność operacji w zwalczaniu oszustw kryptowalutowych.”

Reakcje

  • „FBI opracowało kryptowalutę w celu zbadania schematów typu pump-and-dump, które są oszukańczymi praktykami sztucznie podnoszącymi cenę aktywa przed jego sprzedażą.”
  • „Ta inicjatywa wywołała debaty na temat prowokacji policyjnej i etycznych implikacji związanych z tworzeniem fałszywych papierów wartościowych przez organy ścigania.”
  • „Dyskusja rozszerza się na szersze obawy dotyczące legalności kryptowalut i roli rządu w regulowaniu walut cyfrowych.”

„NotesHub: wieloplatformowa aplikacja do robienia notatek oparta na Markdown”

  • „Aplikacja jest dostępna na wielu platformach, w tym iOS, Android, Windows, Mac, Apple Vision Pro oraz w wersji internetowej, która jest darmową progresywną aplikacją webową działającą offline. Notatki mogą być przechowywane w repozytoriach Git, z najlepszą integracją z GitHub, a także obsługują opcje hostowane samodzielnie, takie jak Gitea, systemy plików lub iCloud Drive. Aplikacja obsługuje bogatą składnię Markdown z rozszerzeniami do tworzenia tablic Kanban, tablic opartych na Excalidraw i zawiera funkcje takie jak notacja muzyczna Mermaid i ABC.”

Reakcje

  • „NotesHub to wszechstronna aplikacja do robienia notatek oparta na Markdown, dostępna na wielu platformach, w tym iOS, Android, Windows, Mac, Apple Vision Pro i w sieci. Aplikacja oferuje darmową wersję Progressive Web App, podczas gdy wersje natywne wymagają jednorazowej opłaty, z silną integracją do przechowywania notatek w repozytoriach Git, takich jak GitHub, GitLab czy Bitbucket. Posiada bogatą składnię Markdown, tablice Kanban i tablice oparte na Excalidraw, a użytkownicy chwalą jej czysty design i możliwości offline, choć nie jest open-source i ma ograniczone wsparcie dla Linuxa.”

„Wyłącznik bezpieczeństwa bez polegania na twojej infrastrukturze”

  • „Nowy projekt w języku Go, Deadcheck, został opracowany, aby działać jako wyłącznik bezpieczeństwa bez polegania na zadaniach cron, timerach czy bazach danych. Deadcheck integruje się z PagerDuty, popularną platformą do zarządzania incydentami, aby utrzymywać incydenty w stanie uśpienia do momentu, gdy zostanie pominięte zameldowanie, co wówczas wyzwala alert. Projekt ten jest godny uwagi ze względu na swoje innowacyjne podejście do zarządzania alertami i incydentami bez tradycyjnych zależności od harmonogramów czy baz danych.”

Reakcje

  • „Deadcheck to projekt w języku Go zaprojektowany jako wyłącznik bezpieczeństwa, eliminujący potrzebę korzystania z zadań cron lub baz danych, i integruje się z PagerDuty w celu zarządzania alertami.”
  • „Projekt wywołał dyskusje na temat wyłączników bezpieczeństwa, w tym aspekty prawne i alternatywne rozwiązania, takie jak korzystanie z prawników lub systemów blockchain.”
  • „Użytkownicy zasugerowali istniejące usługi, takie jak Cronitor lub OpsGenie, dla podobnych funkcjonalności, a projekt planuje rozszerzyć integracje poza PagerDuty.”

„Zrozumienie ograniczeń rozumowania matematycznego w dużych modelach językowych”

  • „Artykuł „GSM-Symbolic” autorstwa Imana Mirzadeha i in. bada zdolności rozumowania matematycznego dużych modeli językowych (LLM) przy użyciu benchmarku GSM8K. Autorzy wprowadzają GSM-Symbolic, nowy benchmark z symbolicznymi szablonami, pokazując, że LLM mają trudności z wariacjami wartości liczbowych i dodatkowymi klauzulami w pytaniach. Badanie sugeruje, że LLM mogą odtwarzać rozumowanie z danych treningowych, a nie wykonywać prawdziwe logiczne rozumowanie, co podkreśla ich ograniczenia w rozumowaniu matematycznym.”

Reakcje

  • „Duże modele językowe (LLM) napotykają trudności w rozumowaniu matematycznym, zwłaszcza gdy problemy zawierają nieistotne informacje, co wpływa na ich wydajność. To ograniczenie podkreśla zależność LLM od rozpoznawania wzorców zamiast logicznego rozumowania, co czyni je mniej skutecznymi w rzeczywistych scenariuszach z dodatkowymi szczegółami. Pomimo postępów, LLM wciąż mają trudności z odróżnieniem ważnych informacji od szumu, co jest kluczową umiejętnością potrzebną do praktycznych zastosowań.”

„ARIA: Otwarty multimodalny natywny model mieszanki ekspertów”

  • „Aria to otwarty, multimodalny natywny model AI, który integruje różnorodne informacje ze świata rzeczywistego dla kompleksowego zrozumienia, przewyższając modele takie jak Pixtral-12B i Llama3.2-11B pod względem wydajności. Jest to model mieszany z 3,9 miliarda i 3,5 miliarda aktywowanych parametrów na wizualny i tekstowy token, odpowiednio, co zwiększa jego możliwości językowe i multimodalne. Wagi modelu i baza kodu są otwarte, co ułatwia ich przyjęcie i adaptację przez deweloperów i badaczy.”

Reakcje

  • „ARIA to nowy multimodalny natywny model Mixture-of-Experts (MoE), który przewyższa Pixtral-12B i Llama3.2-11B pod względem wydajności i szybkości wnioskowania, efektywnie wykorzystując aktywne parametry. Pomimo zużycia pamięci podobnego do modelu 25B, ARIA działa jak model 10B i operuje z szybkością modelu 4B, co czyni go odpowiednim dla urządzeń z odpowiednią ilością pamięci, takich jak M2 Max. Eksperci modelu koncentrują się na składni, z możliwością poprawy w zakresie wyboru ekspertów, i jest obecnie dostępny do testowania, chociaż niektórzy użytkownicy napotkali problemy z platformą.”