Hoppa till huvudinnehåll

2023-04-18

MiniGPT-4

Nyheter.

MiniGPT-4, en språkmodell som anpassar en frusen visuell kodare till en frusen stor språkmodell, Vicuna, med hjälp av endast ett projektionslager, har liknande möjligheter som GPT-4, t.ex. att generera detaljerade bildbeskrivningar och skriva historier och dikter inspirerade av givna bilder. Modellen är mycket beräkningsmässigt effektiv och använder endast cirka 5 miljoner anpassade bild-textpar och kräver endast träning av det linjära lagret för att anpassa de visuella egenskaperna till den stora språkmodellen Vicuna. Skaparna förbereder en lättare modell som kan köras på en enda 3090 GPU för framtida användning.

Industriella reaktioner.

Forskare skapar MiniGPT-4-modellen som presterar bättre än andra genom att koppla BLIP2:s ViT-L+Q-former till Vicuna-13B med ett linjärt lager och träna bara det lilla lagret på vissa bild-text-dataset. Andra kommentarer omfattar modeller för maskininlärning, körning av LLM:er på CPU:er och marknadsföring av produkter baserade på mindre modeller. Forskare vid King Abdullah University utvecklar Vicuna, en GPT-transformatorarkitektur som genererar datorprogram och webbplatser från naturligt språk med förbättrad inlärningseffektivitet. GPTQ 4bits snabbare och effektivare prestanda ger spännande möjligheter för videosammanfattningar och andra tillämpningar för programvara och teknik.

RedPajama: Reproduktion av LLaMA med vänlig licens.

Nyheter.

RedPajama, ett projekt för att skapa ledande modeller med öppen källkod, börjar med att reproducera LLaMA:s träningsdataset med över 1,2 biljoner tokens; RedPajama har tre nyckelkomponenter: förträningsdata, basmodeller och data och modeller för att anpassa instruktionerna; RedPajama har släppt det fullständiga RedPajama-dataset med 1,2 biljoner tokens och ett mindre, mer lättförbrukat slumpmässigt urval kan laddas ner via Hugging Face.

Industry Reactions.

Together XYZ har släppt RedPajama, ett dataset för språkmodeller med öppen källkod som är fyra gånger större än OpenAI:s GPT-3-drivna GPT-3 och som bemöter kritiken från AI-forskare om den slutna karaktären av utveckling och användning av språkmodeller. Kommentarer på Hacker News hänvisar till olika derivat som Pythia, OpenAssistant, StableDiffusion och Midjourney och lyfter fram deras styrkor och svagheter, med fokus på bildkvalitet och kontroll. Det pågår en debatt om upphovsrätten till AI-vikter, och RedPajama står inför utmaningar när det gäller att skapa ett hållbart AI-initiativ med öppen källkod som kan konkurrera med stora teknikföretag.

Samsung överväger att byta till Bing som standardsökmotor.

News.

Samsung uppges föra samtal med Microsoft om att göra Bing till standardsökmotor på sina Galaxy-enheter, inklusive Android-baserade smartphones och surfplattor, och Google verkar vara i "panikläge". Detta kommer samtidigt som tävlingen om att ge de bästa AI-förmågorna till webbsökningar hettar upp, och Google arbetar på sin motkamp, Project "Magi", som enligt uppgift kommer att ge en mycket mer personlig upplevelse än sin nuvarande tjänst. Google bjöd nyligen in anställda att testa AI på sökmotorn, med en möjlig lansering i maj 2023.

Industry Reactions.

Samsung överväger att byta till Bing som standardsökmotor, eventuellt på grund av Googles ökade annonstryck på Google Cloud Platform (GCP) och för att pressa mer betalningar från Samsung och Apple. Bing skulle kunna överbjuda Google i en eventuell sökmotoraffär, och Microsoft pressar Samsung att skapa en ny enhet. Det finns en debatt om Googles försämrade kvalitet och SEO-taktik, vilket driver användarna mot alternativa sökmotorer som ChatGPT, DDG, Brave Search och Bing. Dessutom har Linux desktop-upplevelsen förbättrats, och många användare väljer Linux för arbete, medan Chromebooks föredras inom utbildningssektorn.

Jag gillade denna enkla räkneövning

Nyheter.

Författaren delar med sig av en kalkylövning som kräver att eleverna förstår vad integralen beräknar, i stället för att bara förlita sig på fastställda regler för integrering av vanliga funktioner. För att lösa problemet kan eleverna använda sig av grafer, bryta upp komplicerade funktioner i enklare delar, hantera styckevis kontinuerliga funktioner och utnyttja symmetri. Övningen kan hjälpa eleverna att lära sig värdefulla tekniker och observationen att inte alla problem kan lösas genom att bara skjuta runt symboler.

Industrireaktioner.

Hacker News-användare diskuterar undervisning i kalkyl och föreslår fler övningar för att testa förståelsen. De föreslår också att man använder modern programvara och att man förstärker de grundläggande begreppen under hela kursen. Dessutom delar de med sig av resurser för att verifiera matematiska modeller eller övningar.

Uppstart av moderna Intel-processorer

Nyheter.

  • Vid uppstart av moderna Intel CPU:er kontrolleras signaturer och autentiserade kodmoduler (ACM) för att upptäcka attacker eller skadlig kod.
  • BootGuard, Intels säkerhetslösning för uppstart, verifierar uppdateringar av mikrokod, kontrollerar om det finns rubriker i systemflashen, läser en ACM, verifierar dess signatur och kör IBB i 32-bitarsläge.
  • Inlägget diskuterar att förlita sig på firmware för tunga lyft i stället för OS och är välskrivet för nya läsare från teknikbranschen utan politisk/religiös fördom eller externalisering av texten, men utan några spännande eller nya aspekter.

Industry Reactions.

Intel CPU:er och svårigheterna med att starta upp hjälpprocessorer i flera system diskuteras, tillsammans med sätt att lösa dessa problem genom funktionsanrop och assemblerkod utan att använda minne eller stackar. En del utvecklare uttrycker frustration över felfri firmware och opålitliga produkter, medan andra är nöjda med billigare alternativ som fungerar för deras behov. Samtalet handlar också om att äldre uppstartsstöd överges till förmån för uppdateringar av den fasta programvaran, och att real mode inte längre spelar någon roll vid uppstart av moderna operativsystem.

iOS 17 kommer enligt uppgift att skapa förutsättningar för sidoladdning av appar på iPhone

Nyheter.

Apple kan komma att lägga till möjligheten att sidolägga appar på iPhones i samband med lanseringen av iOS 17, enligt en Bloomberg-rapport. Företaget uppges lägga grunden för en sådan funktionalitet och kan komma att göra ett tillkännagivande i samband med detta vid den kommande Worldwide Developer Conference (WWDC) i juni. Det är oklart om Apple kommer att tillåta sideloading med iOS 17 eller om företaget bara gör vissa ändringar på operativsystemnivå för att möjliggöra det vid en senare tidpunkt.

Industriella reaktioner.

Apples iOS 17 ska enligt uppgift tillåta sidotillverkning av appar på iPhones. Vissa lovordar åtgärden, medan andra oroar sig för att säkerhetsåtgärderna ska försämras. Debatten handlar om att balansera integritets- och säkerhetsskydd med möjligheten att sido ladda appar. Kritiker menar att Apple har ett monopol och måste erbjuda användarna fler alternativ, medan försvarare pekar på Apples överlägsna integritets- och säkerhetsskydd jämfört med konkurrenten Android.

OpenAI:s vd säger att de gigantiska AI-modellerna redan är över.

News.

OpenAI:s vd Sam Altman har sagt att epoken med att göra stora språkmodeller som GPT är snart över. Även om OpenAI fortsätter att göra framsteg inom AI kommer framtida framsteg att kräva nya idéer, och enligt Altman kommer de inte att komma från att bara göra modellerna större. Många välfinansierade nystartade företag försöker komma ikapp OpenAI:s teknik, och GPT-4 signalerar en oväntad vändning i kapplöpningen om att utveckla och använda nya AI-algoritmer.

Industry Reactions.

OpenAI:s vd hävdar att stora AI-modeller inte längre är ekonomiskt genomförbara och att framtida framsteg inom AI kommer att ske genom att modellerna förbättras på andra sätt. Multimodala modeller är den nya gränsen för AI-forskning. Vissa experter är skeptiska till OpenAI:s påståenden om GPT-4:s storlek och förmåga, medan andra pekar på dess potential för exponentiell tillväxt. OpenAI kan behöva hitta nya källor till träningsdata och förbättra algoritmen och datakvaliteten för bättre AI-modeller. Diskussioner om GPT-4:s språkkompetens och begränsningar har lett till diskussioner om att förbättra språkmodeller genom multimodala funktioner, effektivare träningsmål och optimerare samt framsteg inom dataförstärkningar.

Microsoft har tagit bort de offentliga supportforumen för SwiftKey.

News.

Denna text är inte relaterad till rubriken "Microsoft deleted the public support forums for SwiftKey" och kan därför inte sammanfattas därefter. Vänligen ge mig den korrekta texten så att jag kan sammanfatta den.

Industriella reaktioner.

Microsoft har tagit bort de offentliga supportforumen för SwiftKey, som användarna känner sig lojala mot eftersom den lär sig deras skrivstil och blir en förlängning av deras kropp; de kan nu bara skicka e-post till SwiftKeys kundsupport med problem. Kommentarerna omfattar olika ämnen, bland annat identitetskontroll på nätet och effekterna av att spendera för mycket tid på nätet; andra ämnen omfattar frågor om ableism och beroende av sociala medier. I vissa kommentarer diskuteras dock även SwiftKey's styrkor, bland annat inlärning av blandade språkmodeller och ergonomisk design, vilket gör det till ett viktigt alternativ till vanliga tangentbord på Android- och iOS-enheter.

Ingen källkod == Inget patent

Nyheter.

  • Det är viktigt att avslöja källkod i programvarupatent eftersom det bevisar att uppfinnaren kan genomföra uppfinningen och ger patentet trovärdighet, särskilt vid intrångsfall.
  • Genom att inkludera källkod uppfylls kravet på skriftlig beskrivning och möjliggörande helt och hållet, vilket minskar antalet ansökningar om mjukvarupatent och undviker tvetydigheter i konstruktionsspecifikationerna.
  • I artikeln diskuteras rättsfall och det aktuella läget för patent inom datorteknik och digital kommunikation, och behovet av källkod i mjukvarupatent för att lösa frågan om rimliga experiment.

Industry Reactions.

Debatten om huruvida mjukvarupatent bör avskaffas eller behållas väcker diskussion på Hacker News, med argument för och emot patentens nödvändighet för att förhindra stöld av självständigt skapade idéer. Vissa menar att mjukvarupatent hindrar innovation och kräver mer än bara en idé eller ett koncept, t.ex. ett fysiskt objekt eller en arbetskopia, medan andra diskuterar källkodens och algoritmernas relevans för patenträttigheter.

Jag gjorde min blogg solcellsdriven, sedan eskalerade saker och ting.

Nyheter.

En bloggare byggde ett solcellsdrivet system för att driva sin blogg och sitt datorbord med hjälp av solpaneler med en sammanlagd effekt på 740 watt, som drivs via ett 12-voltsystem med ett stort begagnat blybatteri, Victron-solcellsladdare, växelriktare och Filax 2-omkopplare, och insamling av data innebär att man använder Python, InfluxDB och Grafana för att samla in och visa data. Överdimensionerade batterikablar och användning av ett 24- eller 48-voltsystem rekommenderas för säkerhet och minskade kostnader, och ett förseglat bly-syrabatteri används för dess säkerhet. En algoritm för dynamisk belastning förhindrar djup urladdning av batteriet, och en bakgrund med mörkt tema kan spara ström.

Industrireaktioner.

I en tråd i Hacker News diskuteras för- och nackdelar med att använda olika typer av batterier, inklusive bly-syra-, LiFePo4- och solid-state-batterier, för solenergiprojekt, och man föreslår att man bör överväga sina specifika behov och mål innan man bestämmer sig för en batterityp. Experter delar med sig av insikter om kapacitetstestning och plug-in-ersättning av bly-syrabatterier med hjälp av litium-järnfosfatbatterier (LiFePO4), och även om LiFePO4-batterier kan vara lättare och snabbare att ladda, är deras totala livstidskostnad fortfarande jämförbar med bly-syrabatterier. I andra kommentarer ges tips om hur man bygger solenergisystem, t.ex. genom att använda USB-C-strömförsörjning, fördela strömmen över faser och använda 24 V eller likströmskomponenter, samt att föreslå alternativa lösningar som vindkraftverk eller paneler som takbeläggning.

Sälj en berättelse: Hur det blev så fel att lära barn att läsa.

Nyheter.

American Public Medias undersökande journalistikprojekt "Sold a Story" avslöjar de nuvarande undervisningsmetoderna i skolornas läsprogram, som bygger på en sedan länge motbevisad idé om hur barn lär sig att läsa, ursprungligen framlagd av Marie Clay. Produkter som använder dessa vederlagda metoder säljs dock till skolor över hela landet, Heinemann tjänar miljontals dollar och föräldrar, pedagoger och lagstiftare kräver förändringar i systemet. Artiklarna innehåller intervjuer med inflytelserika pedagoger och politiker, forskningsanalyser och vägledningsmaterial för pedagoger och samhällsmedlemmar för att diskutera de aktuella ämnena.

Industrireaktioner.

Olika undervisningsmetoder för barns läsning, såsom fonik och föräldrars engagemang, diskuteras, med tonvikt på individualiserad undervisning och bedömning. Pedagoger och akademiker debatterar effektiviteten av fonikbaserad undervisning kontra undervisning med hela ord, och i artikeln varnas för att blint lita på lärarnas åsikter. Diskussionen innehåller också rekommendationer om användbara resurser för föräldrar, och betonar vikten av att lära ut fonetik för läsförmåga, och kvaliteten på undervisningen i grundskolan är för närvarande under debatt.

Windows 11 Trash Party

Nyheter.

Artikelförfattaren klagar över det standardinnehåll som visas i startmenyn i Windows 11, bland annat en nyhet om en masskjutning som kan vara olämplig för barn, och skräp från MSN:s hemsida i väderleksinformationen. Även om du kan stänga av detta innehåll, menar artikeln att Windows-upplevelsen överlag är en besvikelse.

Industrireaktioner.

Användarna uttrycker oro över Microsofts identitetskris och föreslår ett behov av att förtydliga deras vision och fokus på att vara ett operativsystem för företag. Man uttrycker missnöje med Windows 11 och vissa föreslår att man använder Linux som ett alternativ. Windows påträngande annonser, integritetsfrågor och prestanda kritiseras. Inlägget är irrelevant för tekniskt kunniga läsare som är intresserade av Windows 11:s kritik.

Månatliga Fediverse-inlägg överskrider 1 miljard för första gången

News.

De månatliga Fediverse-inläggen har passerat en miljard för första gången, enligt en ny dataanalys. Mastodon, ett decentraliserat socialt nätverk som drivs av Masto.ai, har 8,9 000 aktiva användare och erbjuder funktioner som att följa hashtaggar och profiler, favorisera, dela och svara på inlägg.

Industry Reactions.

Det decentraliserade sociala nätverket Fediverse har nått en milstolpe på över en miljard månatliga inlägg på olika plattformar, där Mastodon är ett anmärkningsvärt alternativ till Twitter. Medan vissa kritiserar Mastodon för dess mindre användarbas och bristande skalbarhet, berömmer andra dess kvalitetsinteraktioner och gemenskapsdrivna känsla. Mastodon kämpar fortfarande för att vinna mark mot Twitter på grund av centraliseringen, och dess exakta antal dagliga aktiva användare (DAU) är okänt. Dessutom väcker Fediverse oro för sökfunktioner, UX-design och censurfrågor.

AWS-personal spenderar "mycket av sin tid på att optimera kundernas moln".

News.

AWS-personal hjälper kunderna att optimera sina AWS-utgifter så att de kan klara av den osäkra ekonomin, enligt Amazon.com:s vd Andy Jassys årliga brev till aktieägarna. Även om AWS:s tillväxttakt avtar till följd av att kunderna optimerar sina utgifter, ser AWS fortfarande robusta pipelines för nya kunder och aktiva migreringar. Jassy nämnde också AWS:s avsikt att utveckla mer skräddarsytt kisel och potentialen hos satellitbredbandstjänsten Kuiper.

Industry Reactions.

AWS-personal ägnar mycket tid åt att optimera kundernas moln, med blandade omdömen om supporttjänsten, som sträcker sig från bra grundläggande support till problem med olika supportnivåer för kunderna. Företagen kan ha svårt att anställa infraingenjörer med nödvändig kunskap, och övergången till molnet kan leda till att man förlorar kunskap om att arbeta med datacenter. Infrastruktur på plats är kostnadsdrivande och att driva flera datacenter kan vara smärtsamt, medan komplicerade molnarkitekturer kan skapa onödiga operativa bördor. Kostnadseffektiviteten för molndrift jämfört med datorisering på plats är omdiskuterad, med spetsiga eller oförutsägbara belastningar som gynnar molndrift. AWS konkurrerar med mindre, billigare molnleverantörer och utvecklare kämpar med komplexa driftsättningar, driftsstöd och kostnadsoptimering. Molntjänster har blivit dyra och företag flyttar sig från dem beroende på hur de använder dem, men få flyttar sig till en installation på plats på grund av brist på nödvändig kompetens.

Starship Flight Test [video]

Nyheter.

  • SpaceX senaste Starship-prototyp, SN10, har framgångsrikt genomfört en testflygning och landning på hög höjd, vilket gör den till den första som landar utan att explodera.
  • SN10 kunde stiga upp till 10 kilometer och utföra en nedstigning med magen före till landningsplatsen, men en brand efter landningen orsakade skador på raketen.
  • SpaceX vd Elon Musk har meddelat att företaget kommer att prioritera utvecklingen av Super Heavy-boostern för att para ihop med Starship för flygningar i omloppsbana.

Industrireaktioner.

SpaceX planerar att starta Starship på nytt inom 48 timmar efter ett avbrutet flygprov på grund av ett problem med tryckventilen. Användarna på Hacker News diskuterar Starships marknad och lönsamhet, men i artikeln diskuteras det potentiella paradigmskiftet i ekonomin för rymdresor om raketen visar sig vara så återanvändbar som Musk förutspår. Kommentarerna kretsar också kring det centrala temat om uppskjutningshändelsens inverkan på amerikanska tidszoner, och det finns en oro för att demonstranter ska hindra SpaceX:s tester.