2023-04-18
MiniGPT-4
News.
MiniGPT-4, model językowy, który wyrównuje zamrożony koder wizualny z zamrożonym dużym modelem językowym Vicuna, używając tylko jednej warstwy projekcyjnej, posiada podobne możliwości wykazywane przez GPT-4, takie jak generowanie szczegółowych opisów obrazów oraz pisanie opowiadań i wierszy inspirowanych danymi obrazami. Model jest wysoce wydajny obliczeniowo, wykorzystuje jedynie około 5 milionów wyrównanych par obraz-tekst i wymaga jedynie treningu warstwy liniowej w celu wyrównania cech wizualnych z dużym modelem językowym Vicuny. Twórcy przygotowują do wykorzystania w przyszłości lżejszy model uruchamiany na pojedynczym układzie GPU 3090.
Reakcje branży.
Naukowcy tworzą model MiniGPT-4, który przewyższa inne poprzez połączenie formatu ViT-L+Q BLIP2 z Vicuną-13B z warstwą liniową i wytrenowanie tylko tej małej warstwy na niektórych zestawach danych obrazowo-tekstowych. Inne komentarze dotyczą modeli uczenia maszynowego, uruchamiania LLM na procesorach i wprowadzania na rynek produktów opartych na mniejszych modelach. Naukowcy z King Abdullah University opracowują Vicunę, architekturę transformatora GPT, która generuje programy komputerowe i strony internetowe z języka naturalnego z poprawioną wydajnością uczenia. Szybsza i bardziej wydajna wydajność GPTQ 4bit przedstawia ekscytujące możliwości dla streszczania wideo i innych zastosowań w oprogramowaniu i technice.
RedPajama: Reprodukcja LLaMA z przyjazną licencją
News.
RedPajama, projekt mający na celu stworzenie wiodących modeli open-source, rozpoczyna się od odtworzenia zbioru danych szkoleniowych LLaMA o wielkości ponad 1,2 biliona tokenów; RedPajama ma trzy kluczowe komponenty: dane przedtreningowe, modele bazowe oraz dane i modele do strojenia instrukcji; RedPajama wydała pełny zbiór danych RedPajama 1,2 biliona tokenów, a mniejszą, bardziej konsumpcyjną próbkę losową można pobrać za pośrednictwem Hugging Face.
Industry Reactions.
Together XYZ wydało RedPajama, open-source'owy zestaw danych modeli językowych, który jest czterokrotnie większy niż GPT-3 napędzany przez OpenAI i odpowiada na krytykę ze strony badaczy AI dotyczącą zamkniętej natury rozwoju i wdrażania modeli językowych. Komentarze na Hacker News odnoszą się do różnych pochodnych, takich jak Pythia, OpenAssistant, StableDiffusion i Midjourney, podkreślając ich mocne i słabe strony, ze szczególnym uwzględnieniem jakości obrazu i kontroli. Trwa debata na temat możliwości objęcia prawami autorskimi wagi AI, a RedPajama stoi przed wyzwaniem stworzenia trwałej inicjatywy open-source AI, która może konkurować z wielką technologią.
Samsung rozważa przejście na Binga jako domyślną wyszukiwarkę
News.
Samsung podobno prowadzi rozmowy z Microsoftem, aby Bing stał się domyślną wyszukiwarką na jego urządzeniach Galaxy, w tym smartfonach i tabletach opartych na systemie Android, przy czym Google wydaje się być w "trybie paniki". To przychodzi jako wyścig, aby przynieść najlepsze zdolności AI do wyszukiwania w sieci podgrzewa, z Google pracuje na jego kontr-pitch, Projekt "Magi," który będzie podobno zapewnić znacznie bardziej spersonalizowane doświadczenie do swojej obecnej usługi. Google niedawno zaprosił pracowników do testowania AI na wyszukiwarce, z możliwym uruchomieniem w maju 2023 roku.
Reakcje branży.
Samsung rozważa przejście na Bing jako swoją domyślną wyszukiwarkę, potencjalnie z powodu zwiększonej presji reklamowej Google na Google Cloud Platform (GCP) oraz w celu wyciśnięcia większej ilości płatności od Samsunga i Apple. Bing mógłby przebić Google w potencjalnej transakcji dotyczącej wyszukiwarki, a Microsoft naciska na Samsunga, aby stworzył nowe urządzenie. Trwa debata na temat spadku jakości Google i taktyki SEO, popychając użytkowników w kierunku alternatywnych wyszukiwarek, takich jak ChatGPT, DDG, Brave Search i Bing. Ponadto, doświadczenie pulpitu Linuksa uległo poprawie, a wielu użytkowników wybiera Linuksa do pracy, podczas gdy Chromebooki są preferowane w sektorze edukacyjnym.
I liked this simple calculus exercise
News.
Autor dzieli się ćwiczeniem rachunkowym, które wymaga od uczniów zrozumienia, co oblicza całka, a nie tylko polegania na ustalonych regułach całkowania wspólnych funkcji. Aby rozwiązać problem, studenci mogą używać wykresów, rozbijać skomplikowane funkcje na prostsze części, radzić sobie z funkcjami nieciągłymi w kawałkach i wykorzystywać symetrię. Ćwiczenie może pomóc uczniom w poznaniu wartościowych technik i spostrzeżeniu, że nie każdy problem można rozwiązać, przesuwając tylko symbole.
Reakcje branży.
Użytkownicy Hacker News dyskutują na temat nauczania rachunku i sugerują więcej ćwiczeń sprawdzających zrozumienie. Sugerują również używanie nowoczesnego oprogramowania i wzmacnianie podstawowych pojęć w trakcie kursu. Dodatkowo, dzielą się zasobami do weryfikacji modeli matematycznych lub ćwiczeń.
Uruchamianie nowoczesnych procesorów Intel
News.
- Uruchomienie nowoczesnych procesorów Intela wiąże się z weryfikacją sygnatur i wykonaniem modułów uwierzytelnionego kodu (ACM) w celu wykrycia ataków lub złośliwego oprogramowania.
- BootGuard, rozwiązanie bezpieczeństwa Intela dla rozruchu, weryfikuje aktualizacje mikrokodu, sprawdza nagłówki w systemowej pamięci flash, odczytuje ACM, weryfikuje jego sygnaturę i wykonuje IBB w trybie 32-bitowym.
- Post omawia poleganie na firmware do ciężkiego podnoszenia zamiast OS i jest dobrze napisany dla nowych czytelników z branży technologicznej bez politycznego/religijnego uprzedzenia lub eksternalizacji tekstu, ale bez żadnych ekscytujących lub nowych aspektów.
Industry Reactions.
Omawiane są procesory Intel i trudności z uruchamianiem procesorów pomocniczych w wielu systemach, a także sposoby rozwiązywania tych problemów poprzez wywołania funkcji i kod asemblerowy bez użycia pamięci lub stosów. Niektórzy deweloperzy wyrażają frustrację z powodu zbugowanego firmware'u i zawodności produktów, podczas gdy inni pozostają zadowoleni z tańszych alternatyw, które działają dla ich potrzeb. Rozmowa dotyczy także porzucenia starszego wsparcia dla rozruchu na rzecz aktualizacji firmware'u, przy czym tryb rzeczywisty nie odgrywa już roli w uruchamianiu nowoczesnych systemów operacyjnych.
iOS 17 podobno ustawi scenę dla sideloading aplikacji na iPhone'a
News.
Apple może dodać możliwość sideload aplikacji na iPhone'ach wraz z wydaniem iOS 17, według raportu Bloomberga. Firma podobno buduje podstawy dla takiej funkcjonalności i może wydać ogłoszenie z nią związane na nadchodzącej Worldwide Developer Conference (WWDC) w czerwcu. Nie jest jasne, czy Apple pozwoli na sideloading z iOS 17, czy tylko wprowadza pewne zmiany na poziomie systemu operacyjnego, aby umożliwić to w późniejszym czasie w dół drogi.
Industry Reactions.
Apple's iOS 17 podobno pozwala na sideloading aplikacji na iPhone'ach; niektórzy chwalą ten ruch, podczas gdy inni martwią się o zmniejszenie środków bezpieczeństwa. Debata koncentruje się na zrównoważeniu ochrony prywatności i bezpieczeństwa z możliwością sideload aplikacji. Krytycy sugerują, że Apple ma monopol i musi oferować użytkownikom więcej opcji, podczas gdy obrońcy wskazują na lepsze zabezpieczenia prywatności i bezpieczeństwa Apple w porównaniu z rywalem, Androidem.
CEO OpenAI mówi, że era gigantycznych modeli AI już się skończyła
News.
CEO OpenAI, Sam Altman, stwierdził, że era tworzenia wielkich modeli językowych, takich jak GPT, dobiega końca. Chociaż OpenAI nadal czyni postępy w AI, przyszłe postępy będą wymagały nowych pomysłów i według Altmana nie będą wynikały z samego powiększania modeli. Wiele dobrze finansowanych startupów próbuje dogonić technologię OpenAI, a GPT-4 sygnalizuje nieoczekiwany zwrot w wyścigu o opracowanie i wdrożenie nowych algorytmów AI.
Reakcje branży.
CEO OpenAI twierdzi, że duże modele AI nie są już ekonomicznie wykonalne, a przyszły postęp w AI będzie pochodził z ulepszania modeli w inny sposób. Modele wielomodalne są nową granicą badań w AI. Niektórzy eksperci są sceptyczni wobec twierdzeń OpenAI dotyczących wielkości i możliwości GPT-4, podczas gdy inni wskazują na jego potencjał do wykładniczego wzrostu. OpenAI może potrzebować znaleźć nowe źródła danych treningowych i poprawić jakość algorytmu i danych, aby uzyskać lepsze modele AI. Dyskusje na temat kompetencji językowych i ograniczeń GPT-4 doprowadziły do rozmów o poprawie modeli językowych poprzez możliwości multimodalne, bardziej wydajne cele treningowe i optymalizatory oraz postępy w powiększaniu danych.
Microsoft usunął publiczne fora wsparcia dla SwiftKey
News.
Ten tekst nie jest związany z tytułem "Microsoft usunął publiczne fora wsparcia dla SwiftKey" i dlatego nie może być odpowiednio podsumowany. Proszę o podanie poprawnego tekstu, który będę mógł podsumować.
Industry Reactions.
Microsoft usunął publiczne fora wsparcia dla klawiatury SwiftKey, wobec której użytkownicy czują się lojalni, ponieważ uczy się ona ich stylu pisania i staje się przedłużeniem ich ciała; teraz mogą oni jedynie wysyłać e-maile z problemami do zespołu obsługi klienta SwiftKey. Komentarze dotyczą różnych tematów, w tym weryfikacji tożsamości online i skutków spędzania zbyt dużej ilości czasu w sieci; inne obejmują kwestie ableizmu i uzależnienia od mediów społecznościowych. Jednak niektóre komentarze omawiają również mocne strony SwiftKey, w tym mieszane uczenie się modelu językowego i ergonomiczną konstrukcję, dzięki czemu jest to podstawowa alternatywa dla opcji klawiatury stockowej na urządzeniach z systemem Android i iOS.
No Source Code == No Patent
News.
- Ujawnienie kodu źródłowego w patentach na oprogramowanie jest ważne, ponieważ dowodzi, że wynalazca może zaimplementować wynalazek i dodaje wiarygodności patentowi, zwłaszcza w sprawach o naruszenie.
- Włączenie kodu źródłowego w pełni spełnia wymóg pisemnego opisu i umożliwienia, zmniejszając liczbę zgłoszeń patentowych na oprogramowanie i unikając niejednoznaczności w specyfikacjach projektowych.
- Artykuł omawia przypadki prawne i obecny stan patentów w technologii komputerowej i komunikacji cyfrowej, podkreślając potrzebę kodu źródłowego w patentach na oprogramowanie, aby rozwiązać problem rozsądnego eksperymentowania.
Industry Reactions.
Debata nad tym, czy patenty na oprogramowanie powinny być zniesione czy utrzymane, wywołuje dyskusję na Hacker News, z argumentami za i przeciw konieczności patentów w zapobieganiu kradzieży niezależnie stworzonych pomysłów. Niektórzy sugerują, że patenty na oprogramowanie utrudniają innowacje i wymagają czegoś więcej niż tylko pomysłu lub koncepcji, jak fizyczny obiekt lub kopia robocza, podczas gdy inni debatują nad znaczeniem kodu źródłowego i algorytmów dla praw patentowych.
I made my blog solar-powered, then things escalated
News.
Bloger zbudował system zasilany energią słoneczną, aby uruchomić swój blog i biurko komputerowe, używając paneli słonecznych o łącznej mocy 740 W, zasilanych przez system 12 V z dużym używanym akumulatorem kwasowo-ołowiowym, ładowarką słoneczną Victron, falownikiem i przełącznikiem Filax 2, a gromadzenie danych polega na używaniu Pythona, InfluxDB i Grafany do zbierania i wyświetlania danych. Ponadwymiarowe okablowanie baterii i użycie systemu 24 lub 48 V są zalecane dla bezpieczeństwa i zmniejszenia kosztów, a szczelny akumulator kwasowo-ołowiowy jest używany dla jego bezpieczeństwa. Algorytm dynamicznego obciążenia zapobiega głębokiemu rozładowaniu baterii, a tło o ciemnej tematyce może oszczędzać energię.
Reakcje branży.
Wątek Hacker News omawia zalety i wady stosowania różnych typów baterii, w tym kwasowo-ołowiowych, LiFePo4 i baterii półprzewodnikowych, w projektach związanych z energią słoneczną i sugeruje, że należy rozważyć swoje specyficzne potrzeby i cele przed podjęciem decyzji o wyborze typu baterii. Eksperci dzielą się spostrzeżeniami na temat testowania pojemności i wymiany akumulatorów ołowiowo-kwasowych na akumulatory litowo-żelazowo-fosforanowe (LiFePO4), i chociaż akumulatory LiFePO4 mogą być lżejsze i szybciej się ładować, ich całkowity koszt użytkowania jest nadal porównywalny z kosztem akumulatorów ołowiowo-kwasowych. Inne komentarze zawierają wskazówki dotyczące budowania systemów energii słonecznej, takie jak stosowanie zasilaczy USB-C, dzielenie mocy na fazy i stosowanie komponentów 24V lub DC, a także sugerują alternatywne rozwiązania, takie jak turbiny wiatrowe lub panele jako pokrycie dachowe.
Sold a Story: How Teaching Kids to Read Went So Wrong
News.
Projekt dziennikarstwa śledczego American Public Media "Sold a Story" obala obecne metody nauczania w szkolnych programach czytelniczych, które opierają się na dawno obalonym pomyśle na temat tego, jak dzieci uczą się czytać, pierwotnie przedstawionym przez Marie Clay. Jednak produkty wykorzystujące te obalone praktyki są sprzedawane do szkół w całym kraju, a Heinemann zarabia na nich miliony dolarów, zaś rodzice, nauczyciele i ustawodawcy wzywają do zmiany systemu. Artykuły zawierają wywiady z wpływowymi pedagogami i politykami, analizy badań oraz materiały pomocnicze dla pedagogów i członków społeczności, które mogą być wykorzystane do omówienia omawianych tematów.
Reakcje branży.
Omawiane są różne podejścia do nauczania czytania dzieci, takie jak fonetyka i zaangażowanie rodziców, z naciskiem na zindywidualizowane instrukcje i ocenę. Nauczyciele i naukowcy debatują nad skutecznością nauczania opartego na fonice i nauczania całych słów, a artykuł ostrzega przed ślepym zaufaniem opiniom nauczycieli. Dyskusja zawiera również zalecenia dotyczące pomocnych zasobów dla rodziców, podkreślając znaczenie nauczania fonetyki dla biegłości w czytaniu, a jakość edukacji w szkołach podstawowych jest obecnie przedmiotem debaty.
Zabawa w śmieciach Windows 11
News.
Autor artykułu skarży się na domyślną zawartość pojawiającą się w menu Start systemu Windows 11, w tym wiadomość o masowej strzelaninie, która może być nieodpowiednia dla dzieci, oraz śmieci ze strony głównej MSN w alercie informacji o pogodzie. Chociaż można wyłączyć tę zawartość, artykuł sugeruje, że doświadczenie z Windows jest ogólnie rozczarowujące.
Reakcje branży.
Użytkownicy wyrażają obawy dotyczące kryzysu tożsamości Microsoftu i sugerują potrzebę wyjaśnienia ich wizji i skupienia się na byciu systemem operacyjnym dla korporacji. Wyrażane jest niezadowolenie z Windows 11, a niektórzy sugerują użycie Linuksa jako alternatywy. Windows "natrętne reklamy, obawy prywatności i wydajność są krytykowane. Post jest nieistotny dla obeznanych z technologią czytelników zainteresowanych krytyką Windows 11.
Miesięczna liczba postów Fediverse po raz pierwszy przekracza 1 miliard
News.
Miesięczne posty Fediverse po raz pierwszy przekroczyły miliard, jak wynika z ostatniej analizy danych. Mastodon, zdecentralizowana sieć społeczna zasilana przez Masto.ai, może pochwalić się 8,9K aktywnych użytkowników i oferuje takie funkcje jak śledzenie hashtagów i profili, faworyzowanie, udostępnianie i odpowiadanie na posty.
Industry Reactions.
Zdecentralizowana sieć społeczna Fediverse osiągnęła kamień milowy w postaci ponad miliarda miesięcznych postów na różnych platformach, a Mastodon jest godną uwagi alternatywą dla Twittera. Podczas gdy niektórzy krytykują Mastodona za jego mniejszą bazę użytkowników i brak skalowalności, inni chwalą jego jakość interakcji i nastawienie na społeczność. Mastodon wciąż walczy, aby zdobyć ziemię przed Twitterem ze względu na centralizację, a jego dokładna liczba dziennych aktywnych użytkowników (DAUs) jest nieznana. Ponadto Fediverse budzi obawy dotyczące możliwości wyszukiwania, projektowania UX i kwestii cenzury.
Pracownicy AWS spędzają "dużą część swojego czasu na 'optymalizacji chmur klientów'
News.
Pracownicy AWS pomagają klientom w optymalizacji wydatków na AWS, aby mogli przetrwać niepewną gospodarkę, wynika z corocznego listu CEO Amazon.com Andy'ego Jassy do akcjonariuszy. Chociaż tempo wzrostu AWS spada w wyniku optymalizacji wydatków przez klientów, AWS nadal obserwuje solidne rurociągi dla nowych klientów i aktywnych migracji. Jassy wspomniał również o zamiarze AWS, aby rozwijać więcej niestandardowego krzemu oraz o potencjale swojej usługi szerokopasmowego dostępu satelitarnego Kuiper.
Reakcje branży.
Pracownicy AWS spędzają dużo czasu na optymalizowaniu chmur klientów, przy czym opinie na temat usługi wsparcia są mieszane - od świetnego wsparcia podstawowego po problemy z różnymi poziomami wsparcia dla klientów. Firmy mogą mieć trudności z zatrudnieniem inżynierów infra z niezbędną wiedzą, a przejście na chmurę może prowadzić do utraty wiedzy dotyczącej pracy z centrami danych. Infrastruktura on-premises jest kosztowna, a prowadzenie wielu centrów danych może być bolesne, podczas gdy skomplikowane architektury chmurowe mogą tworzyć niepotrzebne obciążenia operacyjne. Efektywność kosztowa przetwarzania w chmurze w porównaniu z przetwarzaniem w siedzibie firmy jest przedmiotem dyskusji, przy czym gwałtowne lub nieprzewidywalne obciążenia faworyzują przetwarzanie w chmurze. AWS konkuruje z mniejszymi, tańszymi dostawcami chmury, a programiści zmagają się ze skomplikowanym wdrożeniem, wsparciem operacyjnym i optymalizacją kosztów. Chmura obliczeniowa stała się droga, a firmy odchodzą od niej w zależności od jej wykorzystania, ale niewiele z nich przechodzi na konfigurację on-prem z powodu braku niezbędnych umiejętności.
Starship Flight Test [wideo]
News.
- Najnowszy prototyp Starship firmy SpaceX, SN10, pomyślnie zakończył testowy lot na dużej wysokości i lądowanie, dzięki czemu jako pierwszy wylądował bez eksplozji.
- SN10 był w stanie wznieść się na wysokość 10 kilometrów i wykonać zejście brzuchem do miejsca lądowania, ale pożar po lądowaniu spowodował uszkodzenie rakiety.
- CEO SpaceX Elon Musk zapowiedział, że firma priorytetowo potraktuje rozwój boostera Super Heavy, który będzie sparowany z Starshipem do lotów orbitalnych.
Reakcje branży.
SpaceX planuje ponowne uruchomienie Starship w ciągu 48 godzin po przerwanym teście lotu z powodu problemu z zaworem ciśnieniowym; użytkownicy na Hacker News debatują nad rynkiem i rentownością Starship, ale artykuł omawia potencjalną zmianę paradygmatu w ekonomii podróży kosmicznych, jeśli rakieta okaże się tak wielokrotnego użytku, jak przewiduje Musk. Komentarze obracają się również wokół centralnego tematu wpływu wydarzenia startowego na strefy czasowe USA, a także pojawiają się obawy o protestujących utrudniających testy SpaceX.