2023-07-22

J'ai écrit une JVM en Rust

L'auteur a créé une JVM en Rust à des fins d'apprentissage, nommée rjvm, qui est une JVM jouet et non une implémentation sérieuse.
La JVM en Rust supporte les instructions de flux de contrôle, les créations de primitives et d'objets, les invocations de méthodes, les exceptions, le ramassage des ordures et la résolution de classes à partir d'un fichier jar.
L'auteur prévoit d'arrêter le projet ici et fournira des explications plus détaillées sur le fonctionnement de la JVM dans de futurs articles.

Réactions de l'industrie

Un développeur a écrit une JVM (machine virtuelle Java) en Rust.
La JVM utilise ses propres piles d'appel virtuelles pour simplifier la traçabilité du ramassage des ordures.
Il s'agit d'une JVM jouet construite à des fins d'apprentissage, et non d'une implémentation sérieuse.

Une étude révèle que des milliards de nanoplastiques sont libérés lors du passage au micro-ondes de récipients

Selon une étude de l'Université de Nebraska-Lincoln, le passage au micro-ondes de récipients en plastique destinés à l'alimentation des bébés peut libérer des milliards de particules nanoscopiques et des millions de particules microscopiques.
Les effets sur la santé de la consommation de ces micro et nanoplastiques sont incertains, mais l'étude a révélé que les trois quarts des cellules rénales embryonnaires cultivées sont mortes après avoir été exposées aux particules.
Il est important d'être conscient du nombre de particules de plastique présentes dans notre alimentation et de limiter l'exposition à ces particules. Les chercheurs espèrent mettre au point des plastiques qui libèrent des quantités moindres ou négligeables de micro- et nanoplastiques.

Réactions de l'industrie

Le passage au micro-ondes des récipients en plastique libère des milliards de nanoplastiques et des millions de microplastiques.
L'exposition aux micro et nanoplastiques peut entraîner la mort des cellules, mais les effets à long terme sur la santé sont encore inconnus.
L'utilisation de matériaux alternatifs comme le verre et l'acier inoxydable pour le stockage et la cuisson des aliments pourrait contribuer à réduire l'exposition aux plastiques.

Proposition d'API pour l'intégrité de l'environnement Web

Ce billet traite d'une proposition de nouvelle API appelée Web Environment Integrity API (API d'intégrité de l'environnement Web).
Cette API permet aux développeurs de déterminer l'intégrité des environnements Web.
Cette proposition fait actuellement l'objet d'un prototype dans Chromium.

Réactions de l'industrie

La proposition d'API pour l'intégrité de l'environnement web est une réponse à la domination des modèles commerciaux basés sur la publicité et à la demande de fonctionnalités supplémentaires dans les navigateurs web.
Les critiques s'inquiètent de la monopolisation potentielle de Google Chrome et de la restriction de la concurrence sur le marché des navigateurs web.
La proposition suscite des débats sur la vie privée, le contrôle et l'avenir du web, avec des discussions sur la conception centrée sur l'utilisateur, les alternatives open-source et l'impact des grandes entreprises technologiques.

Les journalistes devraient faire preuve de scepticisme à l'égard de toutes les sources, y compris les scientifiques

Un groupe d'éminents scientifiques a publié un article sur l'origine du COVID-19 qui contredisait leurs véritables convictions, ce qui a déclenché un scandale.
Des fuites de courriels et de messages Slack révèlent que les auteurs ont manipulé le récit des médias pour minimiser la théorie de la fuite de laboratoire et promouvoir la théorie de l'origine naturelle.
Ce scandale souligne la nécessité pour les journalistes d'être sceptiques à l'égard de toutes les sources, y compris les scientifiques, et de ne pas faire aveuglément confiance aux opinions des experts.

Réactions de l'industrie

Les journalistes doivent faire preuve de scepticisme à l'égard de toutes les sources, y compris les scientifiques, afin de garantir l'exactitude des informations.
La nécessité d'un journalisme responsable et les conséquences potentielles d'un reportage mal documenté sont mises en évidence.
La culture scientifique et la culture statistique sont importantes pour que les journalistes puissent évaluer la recherche de manière critique et présenter des informations exactes au public.

Dans l'espace LLM, "open source" est utilisé pour signifier "poids téléchargeables"

Le terme "open source" est utilisé dans l'espace LLM (Large Language Model) pour désigner les poids téléchargeables des modèles d'IA, plutôt que l'accès complet au code d'apprentissage et à l'ensemble des données.
Un débat est en cours au sein de la communauté de l'IA sur la question de savoir si l'ouverture des poids est suffisante pour qu'un modèle soit considéré comme open source, car certains soutiennent que la véritable ouverture exige le partage de toutes les ressources d'apprentissage.
Le modèle LLaMA2 est un exemple de modèle avec des poids restreints, car il comporte des limitations concernant l'utilisation commerciale et l'entraînement d'un autre grand modèle linguistique avec ses résultats. Cependant, malgré ces limitations, la publication de LLaMA2 sur GitHub est considérée comme un développement positif pour l'avancement de l'espace LLM.

Réactions de l'industrie

Le terme "open source" est utilisé dans le domaine du LLM (Large Language Model) pour désigner les poids téléchargeables, ce qui, selon certains, est trompeur.
Le débat sur la signification du terme "open source" et la complexité des licences dans l'industrie de l'IA soulève des questions sur l'équité, l'accès et la relation entre les LLM et la loi sur les droits d'auteur.
Les restrictions sur l'utilisation et la distribution de LLM tels que LLaMA2 peuvent avoir un impact sur leurs applications commerciales et conduire à un accès basé sur l'API plutôt qu'à des poids téléchargeables.

"World of Warcraft" players trick AI-scraping website into publishing nonsense

Le subreddit World of Warcraft a découvert qu'un site de jeux vidéo récupérait ses fils de discussion et utilisait une IA pour les résumer en articles.
Les utilisateurs du subreddit ont décidé de faire une farce au site web en créant un faux fil de discussion sur une fonctionnalité inexistante appelée Glorbo, que l'IA a ensuite transformé en article.
Cet incident met en lumière le problème du contenu généré par l'IA et le manque de surveillance de certains sites web, et soulève des questions sur le rôle de l'IA dans le journalisme.

Réactions de l'industrie

Des joueurs de "World of Warcraft" ont piégé un site web de récupération d'IA en lui faisant publier des contenus absurdes.
Les joueurs ont remarqué que de nombreux sites de jeux régurgitent les mêmes informations par le biais d'un contenu généré par l'IA.
La prévalence du spam SEO sur les sites de jeux soulève des questions quant à la capacité de Google à filtrer les sources fiables.

Le risque de démence est lié à un déséquilibre des protéines sanguines à l'âge mûr

Des niveaux anormaux de certaines protéines à l'âge mûr pourraient être un signe précoce de la maladie d'Alzheimer ou d'affections similaires.
Une étude portant sur des milliers de personnes pendant 25 ans a identifié 32 protéines qui, si elles sont déséquilibrées entre 45 et 60 ans, sont fortement associées à un risque élevé de développer une démence plus tard dans la vie.
Ces résultats pourraient conduire à la mise au point de nouveaux tests diagnostiques et de nouveaux traitements pour les maladies entraînant la démence.

Réactions de l'industrie

Des chercheurs ont découvert un lien entre un déséquilibre des protéines sanguines à l'âge moyen et un risque accru de démence.
L'étude a identifié 32 protéines fortement associées au risque de démence si leurs niveaux sont déséquilibrés.
Ces protéines sont impliquées dans la protéostase, l'immunité, la fonction synaptique et l'organisation de la matrice extracellulaire.
Certaines de ces protéines se sont également révélées anormalement exprimées dans le tissu cérébral post-mortem de patients atteints de la maladie d'Alzheimer.
Les résultats suggèrent que le dérèglement de certaines voies immunitaires et protéostasiques pourrait contribuer au risque de démence.
L'étude a validé génétiquement neuf des protéines candidates en tant que marqueurs de la maladie d'Alzheimer.
Cette recherche fournit des indications précieuses sur les mécanismes biologiques qui sous-tendent les premières phases de la démence.
D'autres recherches sont nécessaires pour comprendre la relation de cause à effet entre les déséquilibres protéiques et la démence.
Les résultats pourraient potentiellement conduire au développement d'outils de détection précoce et d'évaluation des risques de démence.

Llama : Ajouter l'échantillonnage basé sur la grammaire

Ce billet présente une nouvelle fonctionnalité appelée "grammar-based sampling" (échantillonnage basé sur la grammaire) dans le logiciel Llama.
Cette fonctionnalité ajoute une API qui utilise une grammaire contextuelle sérialisée pour guider et contraindre l'échantillonnage.
Cette fonctionnalité permet aux utilisateurs de spécifier des grammaires pour générer différents types de données, tels que des coups d'échecs, des expressions arithmétiques, JSON, et plus encore.

Réactions de l'industrie

Llama : Add grammar-based sampling" est une nouvelle fonctionnalité qui permet de mieux contrôler la sortie des modèles de langage tels que GPT.
Cette fonctionnalité utilise une grammaire pour contraindre les tokens générés par le modèle, ce qui permet un contrôle plus fin de la sortie.
L'ajout d'un échantillonnage basé sur la grammaire permet de s'assurer que le texte généré respecte des exigences spécifiques en matière de syntaxe ou de format.

Primo - un CMS visuel avec des blocs Svelte, un éditeur de code et SSG

Primo est un CMS visuel qui vous permet de construire facilement des pages et de gérer le contenu à l'aide de blocs.
Il combine la gestion de contenu avec la puissance du développement moderne et offre des fonctionnalités telles que la construction de pages par glisser-déposer et l'édition visuelle de contenu.
Primo permet également la collaboration en temps réel, le déploiement sur Github et l'option d'auto-hébergement ou d'utilisation gratuite de Primo Cloud.

Réactions de l'industrie

Les blocs/tranches de contenu par glisser-déposer des systèmes CMS peuvent être difficiles à gérer et à entretenir, ce qui donne des résultats insatisfaisants pour les créateurs de contenu.
Un CMS sans tête qui sépare la création de contenu et la conception peut être une meilleure approche pour certains projets.
Primo est un CMS visuel avec des blocs Svelte, un éditeur de code et un générateur de site statique qui vise à fournir un moyen rationalisé et accessible de construire et de gérer des sites web.

Les collisions d'horodatage à la nanoseconde sont fréquentes

Les collisions d'horodatage à la nanoseconde sont courantes sur les systèmes modernes, se produisant dans environ 5 % de tous les échantillons lors de la lecture de l'horloge sur les 4 cœurs physiques en même temps.
Cela signifie qu'un horodatage brut à la nanoseconde ne peut pas être considéré comme un identifiant unique.
Le comportement des collisions d'horodatage varie d'un système d'exploitation à l'autre, Linux montrant des augmentations constantes des temps absolus et monotones au sein d'un seul thread, tandis que Mac OS X présente un nombre élevé de collisions avec une résolution de l'ordre de la microseconde.

Réactions de l'industrie

Les collisions d'horodatage à la nanoseconde sont courantes et peuvent entraîner des problèmes lors de la génération d'identifiants uniques.
UUIDv7 est une norme proposée qui combine une composante temporelle et une composante aléatoire pour créer des identifiants uniques.
La précision et l'unicité des horodatages bruts à la nanoseconde font l'objet d'un débat, et des solutions alternatives telles que les ULID et les identifiants séquentiels hiérarchiques sont proposées.