2023-04-18
MiniGPT-4
Nouvelles.
MiniGPT-4, un modèle de langage qui aligne un codeur visuel gelé avec un grand modèle de langage gelé, Vicuna, en utilisant seulement une couche de projection, possède des capacités similaires à celles de GPT-4, telles que la génération de descriptions d'images détaillées et l'écriture d'histoires et de poèmes inspirés par des images données. Le modèle est très efficace sur le plan informatique, puisqu'il n'utilise qu'environ 5 millions de paires image-texte alignées et ne nécessite que l'entraînement de la couche linéaire pour aligner les caractéristiques visuelles sur le grand modèle de langage de Vicuna. Les créateurs préparent un modèle plus léger pouvant être exécuté sur un seul GPU 3090 pour une utilisation future.
Réactions de l'industrie.
Les chercheurs créent le modèle MiniGPT-4 qui surpasse les autres en reliant le formateur ViT-L+Q de BLIP2 à Vicuna-13B avec une couche linéaire et en n'entraînant que la couche minuscule sur certains ensembles de données image-texte. D'autres commentaires portent sur les modèles d'apprentissage automatique, l'exécution des LLM sur les CPU et la commercialisation de produits basés sur des modèles plus petits. Les chercheurs de l'université King Abdullah développent Vicuna, une architecture de transformateur GPT qui génère des programmes informatiques et des sites web à partir du langage naturel avec une efficacité d'apprentissage améliorée. Les performances plus rapides et plus efficaces de GPTQ 4bit offrent des possibilités intéressantes pour le résumé vidéo et d'autres applications pour les logiciels et la technologie.
RedPajama : Reproduction de LLaMA sous licence amicale
Nouvelles.
RedPajama, un projet visant à créer des modèles open-source de premier plan, commence par reproduire l'ensemble de données d'entraînement LLaMA de plus de 1,2 trillion de jetons ; RedPajama a trois composants clés : les données de pré-entraînement, les modèles de base et les données et modèles de réglage des instructions ; RedPajama a publié l'ensemble complet de données RedPajama de 1,2 trillion de jetons et un échantillon aléatoire plus petit et plus consommable peut être téléchargé par l'intermédiaire de Hugging Face.
Réactions de l'industrie.
Together XYZ a publié RedPajama, un ensemble de données de modèles de langage open-source qui est quatre fois plus important que le GPT-3 d'OpenAI et qui répond aux critiques des chercheurs en intelligence artificielle concernant la nature fermée du développement et du déploiement des modèles de langage. Les commentaires sur Hacker News font référence à divers dérivés tels que Pythia, OpenAssistant, StableDiffusion et Midjourney, soulignant leurs forces et leurs faiblesses, en mettant l'accent sur la qualité et le contrôle de l'image. Le débat sur le droit d'auteur des poids de l'IA se poursuit, et RedPajama doit relever le défi de créer une initiative d'IA open-source durable, capable de concurrencer les grandes entreprises technologiques.
Samsung envisage d'adopter Bing comme moteur de recherche par défaut
Actualités.
Samsung serait en pourparlers avec Microsoft pour faire de Bing le moteur de recherche par défaut sur ses appareils Galaxy, y compris les smartphones et les tablettes sous Android, Google semblant être en "mode panique". Google travaille sur son contre-pitch, le projet "Magi", qui offrirait une expérience beaucoup plus personnalisée que son service actuel. Google a récemment invité ses employés à tester l'IA sur son moteur de recherche, avec un lancement possible en mai 2023.
Réactions de l'industrie.
Samsung envisage de passer à Bing comme moteur de recherche par défaut, potentiellement en raison de la pression publicitaire accrue de Google sur Google Cloud Platform (GCP) et pour obtenir davantage de paiements de la part de Samsung et d'Apple. Bing pourrait surenchérir sur Google dans le cadre d'un accord potentiel sur les moteurs de recherche, et Microsoft pousse Samsung à créer un nouvel appareil. Le déclin de la qualité et des tactiques de référencement de Google fait l'objet d'un débat, poussant les utilisateurs à se tourner vers des moteurs de recherche alternatifs tels que ChatGPT, DDG, Brave Search et Bing. En outre, l'expérience du bureau Linux s'est améliorée, de nombreux utilisateurs optant pour Linux au travail, tandis que les Chromebooks sont préférés dans le secteur de l'éducation.
J'ai aimé cet exercice de calcul simple
Actualités.
L'auteur partage un exercice de calcul qui demande aux étudiants de comprendre ce que l'intégrale calcule, plutôt que de s'appuyer sur les règles d'intégration des fonctions courantes. Pour résoudre le problème, les étudiants peuvent utiliser des graphiques, décomposer des fonctions compliquées en parties plus simples, traiter des fonctions continues par morceaux et utiliser la symétrie. L'exercice peut aider les élèves à apprendre des techniques utiles et à constater que tous les problèmes ne peuvent pas être résolus en se contentant de manipuler des symboles.
Industry Reactions.
Les utilisateurs de Hacker News discutent de l'enseignement du calcul et suggèrent davantage d'exercices pour tester la compréhension. Ils suggèrent également d'utiliser des logiciels modernes et de renforcer les concepts de base tout au long du cours. En outre, ils partagent des ressources pour vérifier les modèles mathématiques ou les exercices.
Démarrage des processeurs Intel modernes
Nouvelles.
- Le démarrage des processeurs Intel modernes implique la vérification des signatures et l'exécution de modules de code authentifiés (ACM) pour détecter les attaques ou les logiciels malveillants.
- BootGuard, la solution de sécurité d'Intel pour le démarrage, vérifie les mises à jour du microcode, contrôle les en-têtes dans la mémoire flash du système, lit un ACM, vérifie sa signature et exécute l'IBB en mode 32 bits.
- Il est bien écrit pour les nouveaux lecteurs de l'industrie technologique, sans parti pris politique/religieux ni externalisation du texte, mais sans aucun aspect passionnant ou nouveau.
Réactions de l'industrie.
Les processeurs Intel et les difficultés liées au démarrage de processeurs auxiliaires dans plusieurs systèmes sont abordés, ainsi que les moyens de résoudre ces problèmes par le biais d'appels de fonction et de code d'assemblage sans utiliser de mémoire ou de piles. Certains développeurs expriment leur frustration face aux micrologiciels bogués et au manque de fiabilité des produits, tandis que d'autres se satisfont d'alternatives moins coûteuses qui répondent à leurs besoins. La conversation porte également sur l'abandon de la prise en charge de l'amorçage traditionnel au profit des mises à jour du micrologiciel, le mode réel ne jouant plus aucun rôle dans l'amorçage des systèmes d'exploitation modernes.
iOS 17 ouvrirait la voie au sideloading d'applications sur l'iPhone
Actualités.
Selon un rapport de Bloomberg, Apple pourrait ajouter la possibilité de charger des applications de manière latérale sur les iPhones lors de la sortie d'iOS 17. L'entreprise serait en train de préparer le terrain pour cette fonctionnalité et pourrait faire une annonce à ce sujet lors de la prochaine Worldwide Developer Conference (WWDC) en juin. On ne sait pas encore si Apple autorisera le sideloading avec iOS 17 ou si elle se contente d'apporter des modifications au niveau du système d'exploitation pour le rendre possible ultérieurement.
Réactions de l'industrie.
L'iOS 17 d'Apple autoriserait le chargement latéral d'applications sur les iPhones ; certains saluent cette initiative, tandis que d'autres s'inquiètent d'une diminution des mesures de sécurité. Le débat porte sur l'équilibre entre les protections de la vie privée et de la sécurité et la possibilité de charger des applications en marge. Les détracteurs estiment qu'Apple détient un monopole et doit offrir plus d'options aux utilisateurs, tandis que les défenseurs soulignent la supériorité des protections de la vie privée et de la sécurité d'Apple par rapport à son rival, Android.
Le PDG d'OpenAI affirme que l'ère des modèles d'IA géants est déjà révolue
Actualités.
Le PDG d'OpenAI, Sam Altman, a déclaré que l'ère des grands modèles de langage comme GPT touchait à sa fin. Bien qu'OpenAI continue de progresser dans le domaine de l'IA, les avancées futures nécessiteront de nouvelles idées et, selon M. Altman, il ne suffira pas d'augmenter la taille des modèles. De nombreuses startups bien financées tentent de rattraper la technologie de l'OpenAI, et GPT-4 marque un tournant inattendu dans la course au développement et au déploiement de nouveaux algorithmes d'IA.