Aller au contenu principal

2023-04-10

L'effet LLama : Une fuite a déclenché une série d'alternatives Open Source à ChatGPT

Original. La fuite accidentelle de "Llama", un modèle LLM, a déclenché un mouvement d'alternatives open-source à des modèles comme GPT-4 et Cohere qui ne sont disponibles que via des API. Depuis la fuite, Alpaca, Vicuna, Koala, ColossalChat et ChatLLama, entre autres modèles, ont été publiés, tous construits sur la base de Llama. Les alternatives open-source à ces modèles n'ont pas montré le même niveau de performance jusqu'à la sortie de Llama. La fuite de Llama s'est avérée être l'une des plus grandes étincelles d'innovation dans l'espace LLM open-source, où une guerre entre la distribution open-source et la distribution basée sur l'API se profile à l'horizon. L'effet LLama a prouvé que l'open source est un mécanisme de distribution viable pour les modèles de base, et il existe des sources d'innovation intéressantes dans l'espace LLM.

Discussion Service. La fuite de "l'effet LLama" a donné naissance à des alternatives open-source à ChatGPT, attirant l'attention des experts en technologie. Le GPT-4 fait preuve d'une plus grande intelligence, offrant des capacités de raisonnement et de généralisation par rapport à son prédécesseur, le GPT-3. Les modèles textuels d'IA comprennent le raisonnement spatial et peuvent comprendre des puzzles, mais un réglage manuel est nécessaire. Le niveau réel d'apprentissage des modèles de langage fait l'objet d'un débat, dans l'espoir d'un avenir accessible et démocratisé pour l'IA. La fuite de LLaMA a conduit à une optimisation open-source sur toutes les plateformes ; cependant, les experts critiquent le piratage des logiciels et la réglementation des entreprises d'IA. L'OpenAI pourrait être confrontée à des problèmes juridiques pour avoir utilisé des modèles afin de former des résultats commerciaux. La précision du ChatGPT diverge, certains le considérant comme inutile, tandis que d'autres affirment que le GPT-4 l'améliore à certains égards. Bing/Sydney et ChatGPT ont des personnalités différentes. L'article ne présente pas de nouvelles technologies, mais discute de la nature de la compression de texte.

De l'apprentissage profond à l'apprentissage long ?

(Original) (https://hazyresearch.stanford.edu/blog/2023-03-27-long-learning). Les chercheurs du laboratoire Hazy Research de Stanford améliorent la longueur des séquences dans les modèles de base de l'apprentissage automatique, en se concentrant sur la création de modèles temporels presque linéaires dans la longueur des séquences qui peuvent conduire à des longueurs de contexte de plusieurs millions, voire de plusieurs milliards. Le modèle Hyena est modulable en longueur de séquence jusqu'à 2k en utilisant un petit réseau neuronal qui paramètre les filtres convolutionnels implicitement via un autre petit réseau neuronal avec un temps de mise en œuvre de O(NlogN). Les chercheurs explorent les matrices d'apprentissage et leur lien avec les applications linguistiques. N/A.

Discussion Service. Des chercheurs de Stanford étudient la réduction des coûts pour l'auto-attention dans les longues séquences. L'optimisation du calcul pour les GPU et les co-processeurs peut optimiser les LLM. Scepticisme à l'égard des modèles à contexte plus long, le couplage des LLM avec d'autres systèmes peut créer de nouvelles solutions. La publication du GPT-4 conduit à de nouvelles recherches sur la prédiction du prochain mot, à des percées potentielles dans la mémoire associative à long terme. La compréhension de la représentation K,Q,V est cruciale, tandis que les RNN et les transformateurs ont des implications pour la démocratisation de l'IA. L'allongement de la durée des contextes peut être considéré comme une nouvelle forme de recherche.

EY se voit interdire toute nouvelle activité d'audit en Allemagne

(https://www.economist.com/business/2023/04/05/ey-gets-banned-from-new-audit-business-in-germany). EY s'est vu interdire pendant deux ans d'auditer de nouveaux clients cotés en bourse en Allemagne, l'APAS, l'organisme de surveillance comptable allemand, lui infligeant une amende de 500 000 euros ainsi que la sanction la plus sévère jamais prononcée. Cette décision, qui intervient après trois ans d'enquête sur le rôle d'EY dans le scandale Wirecard, a porté un coup considérable à la réputation et aux finances du géant comptable assiégé. EY avait donné à Wirecard un certificat de bonne santé jusqu'à ce que l'entreprise s'effondre en 2020 à la suite d'allégations de fraude financière massive. Après le scandale de Wirecard, EY a prétendument investi jusqu'à 2 milliards de dollars sur trois ans pour améliorer les audits concernant la technologie et la détection des fraudes, mais aucun auditeur n'est susceptible de faire les choses correctement à chaque fois.

Discussion Service. Ernst & Young (EY) s'est vu interdire de réaliser de nouveaux audits en Allemagne en raison de décisions d'audit incorrectes et de son implication dans le scandale Wirecard. Les cabinets de conseil sous-traitent du personnel moins bien rémunéré pour minimiser les risques, mais cela peut se retourner contre eux. Les auditeurs ne fournissent qu'une assurance raisonnable et ne garantissent pas qu'il n'y aura pas de fraude. Le recours à l'automatisation et à l'IA peut aider à détecter les activités frauduleuses. L'audit devrait être séparé du conseil pour éviter les conflits d'intérêts. La valeur des sociétés de conseil et la nécessité d'avoir une "peau dans le jeu" font l'objet d'un débat.

Coucher de soleil au pôle Sud

(https://brr.fyi/posts/sunset). À la station du pôle Sud, le soleil tourne presque parfaitement dans le sens inverse des aiguilles d'une montre autour du ciel, ne faisant aucune différence entre la "nuit" et le "jour". Par conséquent, le coucher de soleil s'étale sur plusieurs semaines et la température chute rapidement lorsque le soleil est bas dans le ciel, généralement vers la mi-février. Le billet comprend des photographies de couchers de soleil vus de différentes directions, ainsi qu'une vidéo illustrant cet étrange phénomène. La station observe également "l'heure d'été", même s'il n'y a pas de différence visible entre les heures d'un jour donné. L'article précise que la station South Pole suit l'heure de la Nouvelle-Zélande et fournit d'autres données telles que les stades du crépuscule et la première observation d'étoiles de la saison.

Discussion Service. Un article de Hacker News présente de magnifiques photos du coucher de soleil avant une nuit polaire de six mois. Les commentaires traitent de la gestion du manque de lumière solaire, de la régulation de la lumière et de la construction d'installations scientifiques. L'expérience de solargraphie a échoué. La construction d'installations au pôle Sud est impressionnante. Discussion sur le phénomène étrange de la course circulaire du soleil et son effet sur les conditions de vie. L'Antarctique est inhospitalier et il faut se battre pour obtenir une position permettant de voir le lever et le coucher du soleil. Les commentateurs évoquent également les difficultés respiratoires liées au froid extrême. L'article offre une perspective intéressante sur la vie et la recherche en Antarctique.

Un journaliste néerlandais qui écrit des articles critiques sur la Chine fait l'objet d'un plan d'intimidation

(Original) (https://nltimes.nl/2023/04/08/dutch-journalist-writes-critically-china-targeted-bizarre-intimidation-scheme). Marije Vlaskamp, une journaliste néerlandaise critique à l'égard de la Chine, fait l'objet d'un étrange programme d'intimidation depuis l'automne dernier, qui comprend des menaces à la bombe et des messages exigeant qu'elle retire un article. Mme Vlaskamp a déjà écrit des articles critiques sur l'État chinois, en particulier sur l'oppression des Ouïghours et des dissidents chinois aux Pays-Bas. L'ambassade de Chine à La Haye a fait l'objet d'une alerte à la bombe qui mentionnait à la fois Vlaskamp et Wang Jingyu, l'un des sujets de ses articles. Alors que les agresseurs de Mme Vlaskamp ne tentent pas de cacher l'origine chinoise de la menace, l'ambassade de Chine a nié avoir contribué à enhardir les attaquants.

Discussion Service. Un journaliste néerlandais est la cible d'un programme d'intimidation ; les utilisateurs de Discussion Service discutent de l'ingérence chinoise et exhortent les gouvernements à en faire plus. Des postes de police chinois opèrent aux Pays-Bas et dans d'autres pays, et les pays devront peut-être enquêter eux-mêmes sur ce que l'on appelle les "actions grises". Les critiques affirment que les actions de la Chine violent la souveraineté, et certains politiciens ont été menacés en conséquence. Les utilisateurs de Discussion Service discutent du rôle de la Chine dans les récentes alertes à la bombe contre des journalistes dissidents vivant aux États-Unis ; débats sur le gouvernement chinois et ses actions à l'égard des journalistes occidentaux. ASML, une entreprise néerlandaise, apparaît dans un contexte où la Chine vise à s'approprier l'électronique de l'Occident.

Les installations de l'USPS dans l'Utah ne font rien d'autre que déchiffrer l'écriture.

(https://kutv.com/news/eye-on-utah/what-happens-to-mail-with-band-handwriting-united-states-postal-service-letter-carrier-usps-mailwoman-mailman-cursive-taught-in-schools-unreadable-print-envelopes-undeliverable-packages-salt-lake-city-utah). Les installations de l'USPS dans l'Utah sont spécialisées dans le déchiffrage de l'écriture désordonnée sur le courrier. Il emploie plus de 90 personnes qui trient le courrier et utilisent des technologies de pointe pour le traiter. La technologie utilisée permet même de scanner et de numériser les adresses manuscrites. Cette installation montre comment la technologie évolue pour traiter des tâches traditionnelles de manière innovante.

Discussion Service. Le centre USPS de l'Utah est spécialisé dans le déchiffrage de l'écriture cursive à l'aide d'un logiciel fourni par Eagle et Siemens. La reconnaissance de l'écriture manuscrite est un défi pour les employés de la poste et l'intervention humaine est toujours nécessaire. La discussion sur Hacker News aborde l'évolution du travail et des salaires, la propriété, les subventions gouvernementales et les avantages de l'écriture dans les livres. On pense que la communauté mormone de Salt Lake City a contribué au grand nombre de lecteurs qualifiés de l'établissement. Certains suggèrent que l'USPS devrait créer une application mobile, tandis que d'autres s'inquiètent des violations de la vie privée liées à l'utilisation de données privées.

Apple poursuit ses efforts pour empêcher les magasins de détail de se syndiquer

(https://www.bloomberg.com/news/newsletters/2023-04-09/apple-aapl-continues-efforts-to-keep-retail-stores-from-unionizing-lg9gjdx2). Apple tente d'empêcher la syndicalisation de ses magasins de détail, tout en diversifiant sa production de produits et de composants en dehors de la Chine. L'entreprise a récemment connu des suppressions d'emplois et le départ d'un autre dirigeant. L'article mentionne également la sortie prochaine du casque de réalité mixte d'Apple.

Discussion Service. Apple est accusée de tactiques antisyndicales, y compris le refus d'accorder des avantages ; critique des tactiques de négociation du syndicat. Discussion sur les complexités de la syndicalisation et l'impact sur les travailleurs. Un sondage Gallup montre un intérêt croissant pour la syndicalisation, en particulier chez les travailleurs de première ligne. Certains critiquent la faiblesse des salaires et l'absence d'avantages sociaux dans le commerce de détail, tandis que d'autres affirment que les promotions et les licenciements liés à la durée d'emploi pourraient avoir des conséquences négatives pour les entreprises.

PL/Rust 1.0 : un langage de confiance pour Postgres

Original. PL/Rust est un langage procédural chargeable qui permet d'écrire des fonctions PostgreSQL en Rust, offrant un accès à l'interface de programmation serveur de Postgres et des types Rust sûrs sur la plupart des types de données intégrés à Postgres ; les fonctions PL/Rust sont compilées en code machine natif plutôt qu'interprétées, ce qui permet d'obtenir les meilleures performances. PL/Rust est maintenant un langage procédural de confiance pour Postgres sur les systèmes x86_64 et aarch64 si les conditions de compilation appropriées sont remplies, permettant à PL/Rust de vivre dans un univers de Safe Rust ; PL/Rust utilise son propre pilote rustc pour appliquer des lints personnalisés à la fonction LANGUAGE plrust d'un utilisateur pour appliquer certains idiomes de code qu'ils savent ne pas avoir de problèmes de "I-Unsound". Par défaut, PL/Rust n'effectue pas de compilation croisée, mais il doit être installé et activé par la configuration.

Discussion Service. PL/Rust 1.0 fait désormais confiance à Postgres comme alternative pour les fonctions de base de données. Les fournisseurs de services en nuage RDS et Supabase permettent la mise en œuvre de PL/Rust. Il offre des performances exceptionnelles mais reste vulnérable aux problèmes. Les déclencheurs d'événements et les blocs DO n'ont pas encore été intégrés. Rust a accès à l'écosystème de développement, à des types efficaces et à de meilleures performances. Peut limiter l'optimisation des déclencheurs de calcul.

Twitter bloque les Likes et Retweets qui mentionnent Substack

Original. N/A.

Discussion Service. Twitter bloque les likes/retweets mentionnant Substack, provoquant un effet Streisand. Elon Musk accuse Substack de gratter la base de données de Twitter, les experts trouvent cette déclaration absurde. Substack nie toute utilisation abusive des API de Twitter. Critiques des résultats de recherche, des interdictions et des politiques d'utilisation des API de Twitter. Inquiétudes quant à la qualité de la fonction "newsfeed" de Substack. La concurrence entre Twitter et Substack évolue, d'autres protocoles de microblogging sont explorés. Résistance à la transformation du problème en spectacle, appel à la responsabilité des dirigeants. Débats en cours concernant l'abus d'API et le raclage présumé du contenu de Twitter par Substack. Attention à ne pas négliger la situation des employés licenciés de Substack.

Z-Library permet aux utilisateurs de partager des livres physiques

(https://torrentfreak.com/z-library-plans-to-let-users-share-physical-books-through-z-points-230408/). Z-Library, le plus grand dépôt de livres piratés, étend ses services pour inclure un marché de partage de livres physiques, avec des millions d'utilisateurs capables de prendre des livres de poche dans des "Z-Points" dédiés à travers le monde. Il prévoit d'organiser des "points de collecte et de stockage" pour les livres qui "seront le lien entre ceux qui partagent leurs livres et ceux qui en ont besoin", ce qui nécessitera un espace de stockage et un effort d'organisation considérables, de sorte que les centres d'exécution et les services logistiques tiers sont les bienvenus. Une annonce publiée sur le site semble être sérieuse, les internautes suggérant le Vietnam, le Brésil, le Portugal, la Colombie, l'Iran, l'Ouzbékistan, le Nigeria, l'Espagne, l'Inde, l'Argentine, l'Égypte, la France, l'Éthiopie, la Chine et le Ghana comme lieux d'implantation idéaux du point Z. Le site est actuellement à l'écoute des commentaires afin d'améliorer son service.

Discussion Service. Z-Library permettra aux utilisateurs de partager des livres physiques, mais les éditeurs pourraient poursuivre la bibliothèque en justice ; certains suggèrent de numériser les livres, de modifier les lois sur les droits d'auteur ou d'encourager la numérisation des livres. D'aucuns débattent de la faisabilité et de l'impact sur les maisons d'édition du lancement d'un marché de partage de livres dans le monde réel. Les modèles d'octroi de licences pour les livres électroniques ont des conséquences malheureuses, conduisant au piratage comme forme de protestation. Les bibliothèques privées à adhésion ont précédé les bibliothèques publiques et ont souvent fait l'objet de prêts.

Perseus - NextJS alternative en Rust

Original. Perseus est un framework Rust pour les applications web modernes qui génère de l'état à la demande et le transmet à Sycamore, avec Fluent-based I18n ajouté pour la fonctionnalité multilingue, des plugins pour la personnalisation, le tout en WebAssembly pour de hautes performances, et exportable/statiquement servi, facile à installer, et convivial.

Discussion Service. Les utilisateurs discutent de Perseus, une alternative à NextJS basée sur Rust, certains préférant JS pour le développement frontal en raison de l'outillage de Rust. Malgré cela, les percées de Rust dans les niveaux inférieurs de la pile JS suggèrent un potentiel dans l'incorporation de JS/TS dans les frameworks Rust comme Perseus. La discussion porte sur les mérites de Rust par rapport à Go, certains utilisateurs considérant que Rust est plus adapté à la programmation de bas niveau et d'autres que Go est mieux adapté au développement web. La valeur d'un langage de programmation dépend de l'endroit où l'on vit et où l'on veut travailler. La sortie de Perseus attire l'attention des personnes averties en matière de technologie en tant qu'alternative plus rapide à Svelte, mais fait l'objet de critiques en raison de sa difficulté à être utilisé dans le monde réel.

Un bébé GPT

Original. N/A.

Discussion Service. Un utilisateur de Discussion Service propose d'utiliser des expressions régulières binaires pour les relations linguistiques, tandis qu'un autre plaide en faveur du sens et de l'intention. Le créateur du bébé GPT le compare à une chaîne de Markov. Un expert recommande de meilleurs outils mathématiques. Un utilisateur de Discussion Service s'interroge sur les implications pour le grand public. Aucune nouvelle technologie ou publication notable.

Deux types d'ingénieurs logiciels

Original. L'article traite de deux types d'ingénieurs logiciels : Le type 1, qui suppose qu'un problème est facile s'il n'est pas technique, et le type 2, qui suppose qu'il est difficile parce qu'il implique des personnes. Le type 1 croit en l'ingénierie avec un E majuscule, tandis que le type 2 se concentre sur les personnes et considère que les problèmes d'ingénierie impliquent des personnes. Si le type 1 est le plus courant, les ingénieurs de type 2 comprennent que l'ingénierie implique le chaos et la complexité et cherchent à construire en dépit de ces défis. L'article inclut quelques exemples pour illustrer les différences, mais l'auteur n'a pas encore défini ou tracé précisément la ligne de démarcation entre les deux types.

Discussion Service. Discussion sur les deux types d'ingénieurs logiciels, y compris le type 3, et sur l'importance de comprendre la gestion des produits. Débat sur l'équilibre entre l'innovation et la stabilité, et sur la nécessité d'une documentation appropriée. Dichotomie entre le recours aux personnes et la mise en œuvre de solutions automatisées dans le domaine de l'ingénierie logicielle. Importance d'aligner tout le monde sur des objectifs communs et de comprendre les besoins plus larges de l'entreprise. La catégorisation des ingénieurs logiciels est remise en question, l'accent étant mis sur la recherche des causes profondes des problèmes. L'article est une source de réflexion.

Programmation avancée de Linux (2001)

Original. Advanced Linux Programming' par CodeSourceryLLC est un livre qui aide les développeurs GNU/Linux à créer des logiciels avec des fonctionnalités conviviales, des capacités avancées telles que le multithreading, la communication interprocessus et l'interaction avec les périphériques matériels, ainsi qu'une amélioration générale du programme. En outre, ce livre enseigne aux développeurs comment travailler dans l'environnement système GNU/Linux, y compris ses limitations, conventions et capacités uniques. Ce livre peut être téléchargé sous la licence de publication ouverte, version 1, et donne accès à des échantillons de code couverts par la licence publique générale de GNU. Des errata et des traductions du livre sont disponibles.

Discussion Service. Les utilisateurs de Hacker News discutent de la pertinence du livre de 2001, "Advanced Linux Programming" en 2021. Certains utilisateurs suggèrent de mettre à jour les sections obsolètes. Bien qu'il s'agisse d'un livre pour débutants, il reste une ressource utile pour le développement d'API Linux. L'application de téléchargement Aria2 sert d'alternative aux limitations de vitesse des serveurs.

Un CERN pour l'IA Open Source à grande échelle

(https://www.openpetition.eu/petition/online/securing-our-digital-future-a-cern-for-open-source-large-scale-ai-research-and-its-safety). LAION e.V. a lancé une pétition en faveur d'un centre international de recherche sur les supercalculateurs à source ouverte pour l'IA, financé par des fonds publics, semblable au CERN, afin de démocratiser la recherche sur l'IA et de promouvoir la recherche sur la sûreté et la sécurité. La plateforme openPetition vise à renforcer la participation des citoyens et à soutenir les pétitions en faveur du changement. L'initiative vise à empêcher que les principes démocratiques ne soient sapés par un petit nombre de grandes entreprises. Un utilisateur de Discussion Service a noté que 19 % des soutiens proviennent de laion.ai, tandis que 64 % restent inconnus. Les citoyens sont encouragés à faire un don pour soutenir la pétition qui a gagné du terrain sur Hacker News.

Discussion Service. Un article d'openpetition.eu souligne la nécessité pour l'Europe de mettre en place une initiative open source de type CERN afin de promouvoir la collaboration entre les chercheurs, les universitaires et les entrepreneurs dans le domaine de l'IA. La collaboration est nécessaire pour effectuer le traitement des grandes données avec des investissements importants. Les projets open source sont nécessaires pour retenir les chercheurs en IA et profiter à la société plutôt qu'aux actionnaires des entreprises. Le succès du CERN en fait un modèle attrayant, même si certains suggèrent que le marché fournit des incitations adéquates. La nature interdisciplinaire de l'IA nécessite la prise en compte de questions interconnectées.

Moteur Permafrost - Un moteur de jeu RTS OpenGL écrit en C

Original. Permafrost Engine est un moteur de jeu de stratégie en temps réel OpenGL 3.3 écrit en C, conçu à l'image des vieux classiques mais incorporant quelques idées modernes. EVERGLORY est le jeu phare développé à l'aide de Permafrost Engine, qui présente les capacités du moteur avec une expérience de jeu de première main. Le résumé du moteur comprend une liste des fonctionnalités OpenGL et Python, des mécanismes RTS et des capacités multiplateformes. La licence de Permafrost Engine est la GPLv3, avec une exception spéciale pour les liens. Des instructions de construction sont fournies pour Linux et Windows. Un devlog et un email pour les questions/commentaires concernant le projet ou le code source sont fournis pour les utilisateurs intéressés.

Discussion Service. Le moteur open-source Permafrost attire l'attention sur Discussion Service pour un nouveau jeu RTS open-source. La clarté de la police du jeu Everglory est critiquée. Comparaison demandée avec d'autres moteurs RTS. Les tests des développeurs sur les écrans d'ordinateur de poche sont importants. L'espoir d'un renouveau du genre RTS. Les utilisateurs discutent des moteurs RTS open-source et des langages utilisés. Mention d'une autre implémentation du moteur Frostbite en open-source.

Fermeture d'une connexion SSH périmée

Original. Cet article explique comment fermer une session SSH périmée, en précisant que la première solution consiste à fermer l'émulateur de terminal, mais qu'il existe un meilleur moyen d'utiliser les séquences d'échappement SSH intégrées. L'article explique comment le préfixe tilde () suivi d'une commande peut déclencher plusieurs commandes cachées dans les clients SSH, y compris la commande "Terminer la session" (.). L'article précise qu'il faut faire attention au fait qu'une nouvelle ligne doit précéder le préfixe, et propose une petite note pour les personnes qui utilisent un clavier avec une disposition nordique pour taper le caractère tilde. L'article se termine par une discussion sur ce qu'il faut faire après avoir utilisé la séquence d'échappement 'terminate session'.

Discussion Service. Un utilisateur de Discussion Service donne une astuce SSH. Un autre utilisateur signale un problème de mise en page mais propose une solution de contournement. La configuration d'EscapeChar est suggérée. Discussion sur la page de manuel SSH, le saut d'hôte et les connexions SSH. Une session SSH collante est souhaitée. Autossh est recommandé pour l'attachement automatique, et Mosh pour changer la redirection de port. Des détails sur le cryptage et des conseils supplémentaires sont fournis. Mise en garde contre l'utilisation de Alpine Linux.

Flatcar Container Linux

Original. Flatcar Container Linux est une distribution Linux communautaire conçue pour les charges de travail en conteneur, avec une sécurité élevée et une maintenance réduite. L'image du système d'exploitation ne comprend que les outils nécessaires à l'exécution des conteneurs, sans gestionnaire de paquets ni dérive de configuration. Le système de fichiers immuable et les mises à jour atomiques automatisées constituent une base solide pour la sécurité de l'infrastructure. Les fonctions de sécurité intégrées et la surface d'attaque réduite de Flatcar Container Linux simplifient la gestion du système d'exploitation. Il comprend des outils de gestion des infrastructures à grande échelle et prend en charge les initiatives mondiales. Les mises à jour atomiques automatisées garantissent que vous utilisez la version de Flatcar la plus stable, la plus sûre et la plus récente. Il s'agit d'un remplacement direct de CoreOS Container Linux.

Discussion Service. La mise à jour de Microsoft Flatcar Container Linux se poursuit après l'acquisition, offrant une alternative à CloudInit. L'approche de l'infrastructure immuable gagne en popularité malgré les problèmes techniques d'Ignition. Les développeurs de Flatcar Linux proposent une mise à jour conviviale. Les utilisateurs de Discussion Service discutent de l'ajout de conteneurs et suggèrent un micrologiciel UEFI pour de meilleures performances.

Microsoft / JARVIS : un système pour connecter les LLM à la communauté ML

Original. Microsoft et Hugging Face ont dévoilé le projet de laboratoire JARVIS, un assistant d'IA pour connecter les modèles de langage et d'apprentissage automatique. JARVIS utilise un grand modèle de langage (LLM) pour comprendre et analyser les demandes, puis utilise une sélection de nombreux modèles experts pour exécuter la tâche requise. Il comprend quatre étapes : la planification de la tâche, la sélection du modèle, l'exécution de la tâche et la génération de la réponse. L'utilisateur peut profiter d'une expérience légère avec JARVIS sans déployer les modèles localement en activant son mode CLI ou la page web, qui présente une interface conviviale qui communique avec JARVIS.

Discussion Service. Microsoft lance JARVIS pour connecter les LLM à la communauté ML en utilisant des approches basées sur des règles et l'apprentissage automatique. Certains se demandent si les agents autonomes de l'IA peuvent commettre des fraudes ou des escroqueries, mais les lecteurs sont surtout enthousiastes. Jarvis génère du texte et des images sur la base des modèles choisis par les LLM, mais certains s'inquiètent des questions de marque et d'écoute.

Un tokamak sphérique atteint des températures de plasma cruciales

(https://www.eetimes.com/spherical-tokamak-achieves-crucial-plasma-temperatures/). Le tokamak sphérique de Tokamak Energy a atteint des températures ioniques de plus de 100 millions de degrés Kelvin - une étape cruciale dans le développement de la technologie de l'énergie de fusion. La petite taille, la stabilité du plasma et les propriétés de confinement magnétique des tokamaks sphériques en font un choix intéressant pour la production commerciale d'énergie de fusion. Steven McNamara, directeur scientifique de Tokamak Energy, estime que l'entreprise peut mettre l'énergie de fusion en réseau d'ici dix ans, en complément d'autres sources d'énergie renouvelables. Cette percée utilise la diffusion Thomson pour mesurer la température et la densité en plusieurs points, ouvrant ainsi la voie à des centrales de fusion commerciales déployables et peu coûteuses. La technologie a également des applications potentielles dans le domaine de l'aviation durable et de la production d'hydrogène.

Discussion Service. Un tokamak sphérique permet d'atteindre des températures de plasma cruciales. Certains utilisateurs discutent des problèmes structurels, l'un d'entre eux recommande un podcast sur l'énergie de fusion. L'article explique la nécessité d'un échangeur de chaleur et les coûts réduits de la nouvelle conception. La viabilité de la fusion commerciale est débattue. Le doublement de la force de l'aimant dans les essais à petite échelle fait avancer les choses. Les avantages de la fusion par rapport à la fission en matière de déchets et de sécurité sont notés. Les tokamaks sphériques sont une application de pointe. L'étape franchie n'est pas encore utile, mais des progrès ont été réalisés en ce qui concerne la force de l'aimant.

Les premiers "œufs de Pâques" du jeu étaient un acte de rébellion de l'entreprise

(https://thehustle.co/the-first-easter-eggs-were-an-act-of-corporate-rebellion/). Les premiers œufs de Pâques dans les jeux vidéo sont le résultat de concepteurs à qui l'on a refusé le crédit pour leur travail, ce qui a donné lieu à des messages cachés dans les jeux. Le premier œuf de Pâques a été trouvé dans le jeu "Adventure" d'Atari en 1980, créé par Warren Robinett. La tradition des messages cachés s'est poursuivie dans les jeux d'arcade des années 1970, en quête de reconnaissance et d'individualité. L'œuf de Pâques de Robinett a élevé son statut, et il a ensuite développé une entreprise de logiciels prospère. Le Tech Times fait état de divers cookies utilisés par les entreprises pour suivre le comportement en ligne des utilisateurs et personnaliser les publicités, mais ils n'ont pas encore été classifiés.

Discussion Service. Un article de Hacker News sur la rébellion des entreprises à travers les œufs de Pâques présente des anecdotes et les politiques actuelles des entreprises. L'intérêt des lecteurs peut être piqué par la pertinence historique et l'évolution du rôle de l'œuf de Pâques. Les œufs de Pâques actuels expriment la fierté de l'entreprise et non l'insubordination. Les révisions de code empêchent les œufs de Pâques. Les anciennes entreprises technologiques tombent souvent sous la coupe de MBA nouvellement nommés. Warren Robinett est félicité pour son jeu Adventure. Le membre de U2 et le fan d'Atari ont des noms différents.

Erreurs modulaires en Rust

Original. L'article traite de l'importance de la gestion modulaire des erreurs et introduit le principe selon lequel les types d'erreurs sont proches de leur unité de faillibilité, en utilisant une bibliothèque Rust hypothétique comme exemple. Les problèmes liés aux messages d'erreur peu utiles, à l'inextensibilité et à la difficulté de faire correspondre les erreurs sont soulignés, et des solutions telles que la méthode .source() et une meilleure construction des types d'erreur sont suggérées. Le type d'erreur de la bibliothèque d'exemple est divisé en trois types distincts avec de bonnes traces et une correspondance d'erreur précise, et les erreurs d'E/S sont expliquées grâce à une conception de type d'erreur plus structurée. L'article souligne l'importance de bonnes traces, de l'extensibilité, de l'inspectabilité, de la stabilité et de la modularité dans la gestion des erreurs, et suggère qu'une bonne gestion des erreurs vaut la peine d'être apprise.

Discussion Service. Les messages d'erreur de Rust sont populaires mais des types d'erreur variés sont nécessaires. SNAFU permet de produire des traces uniques. Des erreurs distinctes réduisent la prolifération et facilitent la gestion, mais attention à la prise en charge des API publiques. La journalisation et la terminaison ne doivent pas être les principales méthodes de débogage des bibliothèques. Les erreurs granulaires ou opaques avec des descriptions sont préférables. Les exceptions vérifiées en Java sont appréciées. Le défaut fatal de Java est de ne pas avoir de types algébriques.

68-95-99.7 Règle

Original. La règle 68-95-99.7 est une approximation statistique estimant le pourcentage de valeurs se situant dans un écart-type par rapport à la moyenne dans une distribution normale. La règle stipule qu'environ 68 %, 95 % et 99,7 % se situent respectivement à l'intérieur d'un, de deux et de trois écarts types. Cette règle a de multiples usages dans différents domaines, tels que le contrôle de la qualité et l'analyse des données. Elle permet d'obtenir rapidement une estimation approximative des probabilités pour une population supposée normale. La formule peut être appliquée à différentes distributions et peut aider à identifier les valeurs aberrantes dans l'analyse des données.

Discussion Service. Les commentaires de Discussion Service discutent des limites de la règle 68-95-99.7 dans l'analyse des données. Les travaux de Nassim Nicholas Taleb et l'inégalité de Chebyshev sont mentionnés. Des commentaires sur les transactions financières et l'histoire du marché des options aux États-Unis. Les utilisateurs experts affirment que les scores de QI élevé ne sont pas fiables et que l'échelle est arbitraire.

UnicodePlots

Original. La bibliothèque UnicodePlots est un outil de traçage de haut niveau à utiliser dans la REPL de Julia qui comprend des diagrammes de dispersion, des diagrammes linéaires et des cartes thermiques. Elle supporte également les quantités physiques de Unitful.jl et les intervalles de IntervalSets.jl, permet la personnalisation des caractéristiques de tracé telles que la hauteur et la largeur du tracé et l'inversion/le retournement des axes de tracé, et supporte l'enregistrement des tracés au format PNG ou TXT.

Discussion Service. UnicodePlots, basé sur Julia, affiche des graphiques et des histogrammes sur le terminal pour des visualisations rapides sur des serveurs distants. Il répond à un besoin de visualisation rapide des données dans le terminal, sans installer une pile graphique complète. UnicodePlots est principalement copié dans un portage Ruby, et une version Python compatible avec Matplotlib. Il y a actuellement une tendance vers les interfaces utilisateur textuelles, créant une division entre Electron pour les applications de l'utilisateur final et TUI pour les outils portables. Il couvre 100 % du code, prend en charge les histogrammes comparatifs et permet aux utilisateurs de copier et de coller des données directement dans les commentaires ou les descriptions. Bien qu'il ne s'agisse pas d'une technologie entièrement nouvelle, UnicodePlots est un outil utile pour ceux qui ont besoin d'évaluer rapidement des données.

Les objets de collection numériques sur Instagram s'essoufflent

Original. À partir du 11 avril 2023, Instagram réduira progressivement son soutien aux objets de collection numériques, ce qui affectera la création de nouveaux posts d'objets de collection numériques, la visibilité des portefeuilles numériques et l'accessibilité des informations de la blockchain. La suppression des données des objets de collection numériques se fera conformément à la politique de confidentialité d'Instagram et aux conditions d'utilisation des objets de collection numériques, mais les utilisateurs peuvent soumettre une demande de téléchargement de leurs informations avant la date limite. Le contenu des portefeuilles numériques de tiers ne sera pas affecté.

Discussion Service. Les objets de collection numériques d'Instagram sont en perte de vitesse, mais les adeptes du web3 ne sont pas découragés. L'espace NFT doit se pencher sur les normes de propriété et l'adoption par les entreprises. Les avatars de Reddit se vendent bien, mais les NFT polygonales sont perçues comme moins précieuses. L'hiver est le bienvenu pour les constructeurs d'infrastructures et pour les entreprises traditionnelles qui découvrent les réseaux décentralisés. Le succès des cartes Pokemon et des fonctionnalités de Reddit est comparé au concept de rareté. L'expression "Web3" est peut-être prématurée et les escrocs et les bâtisseurs sont dans des camps différents. Le scepticisme et les préoccupations concernant le battage médiatique des NFT, les risques d'investissement et la santé mentale. L'implication des sectes dans les industries, les crypto-monnaies et les risques liés à l'IA sont discutés. L'utilité de ChatGPT est débattue, et les utilisateurs se concentrent sur les nouvelles idées sans langage politique ou religieux. Le contexte de la technologie avancée en ce qui concerne la communication et la synchronisation terrestre est discuté, avec des opinions variées sur la valeur des NFT et leur impact sur la société.

L'arrêt qui menace l'avenir des bibliothèques

(https://www.theatlantic.com/ideas/archive/2023/04/internet-archive-libraries-federal-court-ruling/673615/). Une décision d'un tribunal fédéral selon laquelle le prêt numérique contrôlé (CDL) viole la loi sur le droit d'auteur pourrait avoir des conséquences désastreuses pour les bibliothèques, qui devraient notamment choisir entre l'achat de coûteuses licences de livres électroniques auprès des éditeurs et l'élargissement de leurs collections. L'Internet Archive (IA), une organisation à but non lucratif qui prête des copies numériques des millions de livres qu'elle a collectés et numérisés, a été au centre d'un procès intenté par plusieurs éditeurs de livres qui l'ont poursuivie en 2020 en invoquant une violation du droit d'auteur ; C'est ce modèle de prêt de CDL que le tribunal a rejeté le mois dernier, car il pourrait avoir "un pouvoir injuste sur l'avenir des livres et des bibliothèques", selon l'avocate Corynne McSherry de l'Electronic Frontier Foundation, qui représente l'IA dans son appel de la décision.

Discussion Service. Une décision de justice sur le prêt numérique contrôlé et les lois sur le droit d'auteur a suscité des débats, avec des suggestions pour raccourcir la durée du droit d'auteur afin d'éviter la perte de connaissances ; certains suggèrent que les profits des éditeurs ne devraient pas être le problème dans le prêt de matériel CDL. Les bibliothèques se sont adaptées pour devenir des centres de divertissement publics, et l'accès du public aux ressources est essentiel ; les bibliothécaires utilisent l'avis d'experts pour trouver un équilibre entre la popularité de la circulation, la valeur du livre et la mission de la bibliothèque lors de la mise au rebut des livres. Les procès intentés par les éditeurs contre la distribution numérique illimitée et libre de droits d'Internet Archive compromettent les revenus des écrivains, et le prêt numérique contrôlé pourrait mettre en péril la protection des lois sur le droit d'auteur. L'intersection de la propriété numérique et physique reste un sujet de débat ; les discussions offrent des perspectives uniques sur la question en jeu.

Do Kwon a converti des fonds illicites de LUNA en bitcoins.

(https://cointelegraph.com/news/do-kwon-converted-stolen-funds-from-luna-to-bitcoin-s-korean-prosecutors). Les procureurs sud-coréens ont identifié près de 314,2 millions de dollars d'actifs illicites liés au cofondateur de Terraform Labs, Do Kwon, et à ses associés, dont 69 millions de dollars pour le seul Kwon. Les procureurs ont contacté Binance pour qu'elle interrompe toute demande de retrait liée à Kwon. Kwon aurait converti la plupart des fonds illicites, qui s'élèvent à environ 414,5 milliards de wons, en bitcoins, et aucun des actifs qui lui sont liés n'est récupérable ou ne relève de la compétence des autorités sud-coréennes. Terra est un écosystème cryptographique qui s'est effondré en mai 2022 et dont l'ancien PDG, Kwon, a été accusé d'avoir détourné des bitcoins d'une valeur de près de 100 millions de dollars après l'effondrement.

Discussion Service. Les données de la chaîne montrent la conversion en bitcoins des fonds frauduleux de LUNA par Do Kwon, de Terraform Labs. Les limites de la traque de la fraude par les banques traditionnelles sont mises en évidence. Les utilisateurs de Discussion Service discutent des outils de protection de la vie privée et de l'honnêteté dans l'espace cryptographique. Débat sur la question de savoir si l'intelligence a évolué dans le sens de la concurrence ou de la coopération, certains plaidant pour la seconde solution. La concurrence et la prédation entraînent la concurrence, mais la tendance générale est de continuer à débattre des rôles dans l'évolution de l'intelligence.

Interview d'Andrew Kelley (créateur de Zig) (2021)

Original. Andrew Kelley parle de son expérience dans le développement du langage de programmation Zig, des difficultés à concilier un emploi à temps plein et le travail sur les logiciels libres, de l'importance de la négociation de la propriété intellectuelle et des questions morales que soulève le forçage commercial dans la communauté des logiciels libres. Zig est un langage de programmation à but non lucratif qui vise à améliorer la sécurité de la mémoire et à réduire la surcharge d'informations pour les utilisateurs. M. Kelley envisage de faire de Zig le langage de prédilection des systèmes d'exploitation et des manuels, ce qui permettrait d'améliorer les performances des applications, l'utilisation de la mémoire et la stabilité. Tech Times fait également état de plusieurs cours vidéo sur la programmation disponibles en ligne.

Discussion Service. L'interview du créateur de Zig, Andrew Kelley, par Corecursive, incite les auditeurs à télécharger tous les podcasts précédents sur le site web, en discutant des projets de financement par la foule et des conseils personnels dans des commentaires séparés. Un auditeur apprécie l'atmosphère conviviale du canal #chicken scheme. Un autre souligne la transparence d'Andrew Kelley dans un incident de forkage de Zig, mais un utilisateur réagit négativement à son interaction avec Kelley. Dans l'ensemble, les auditeurs apprécient la couverture de l'interview sur Zig et l'histoire technique de SQLite.

Show Discussion Service : Supavisor - un pooler de connexion Postgres écrit en Elixir

Original. Supavisor est un pooler de connexions Postgres qui permet de transformer des millions de connexions de clients finaux Postgres en un pool de connexions de bases de données Postgres natives via une architecture évolutive et cloud-native. Ce système simplifie la gestion des clusters Postgres pour les gestionnaires de bases de données en facilitant la configuration de clusters Postgres hautement disponibles, tout en étant efficace en termes de ressources, évolutif, multi-tenant et Cloud-native. Il existe déjà des benchmarks et des tests de charge disponibles, qui montrent qu'il peut gérer un million de connexions Postgres sur un cluster et qu'il peut absorber des millions de connexions, ce qui en fait un excellent choix pour les développeurs qui se connectent à Postgres à partir d'environnements Serverless. Les travaux futurs incluent l'équilibrage de charge, le pooling de sessions, la gestion de la haute disponibilité de Postgres, et des API comme Postgres binary, HTTPS, et bien plus encore. José Valim et l'équipe de Dashbit ont contribué à éclairer les décisions de conception de Supavisor, et il est inspiré par des produits tels que PgBouncer, Amazon RDS Proxy, Google Cloud SQL Proxy, et plus encore.

Discussion Service. Le PDG de Supabase présente Supavisor, un pooler de connexion Postgres construit avec Elixir, soulignant sa similarité avec Pgbouncer et conçu pour la multi-location. Les benchmarks de Supavisor indiquent qu'il peut gérer un débit élevé tout en consommant 7.8G RAM et ~50% CPU sur une machine 64vCPU. Supabase prévoit d'avoir Supavisor en face de toutes ses bases de données, en augmentant la capacité de calcul avec zéro temps d'arrêt. Les utilisateurs de Discussion Service demandent l'ajout de prepared statements en mode transaction pooling et suggèrent d'utiliser Nimble_pool plutôt que Poolboy, tout en faisant l'éloge de la prise en charge de la concurrence et de la nature tolérante aux pannes d'Elixir. Un utilisateur de Discussion Service partage son expérience de travail avec Pgbouncer sur 4 machines vCPU et un autre parle de son pool de Pgbouncers communs qui se dirigent vers diverses instances PostgreSQL en utilisant le proxy Cloud SQL de Google.

Nouvelles allégations de plagiat contre Roy Lichtenstein

(https://www.theguardian.com/artanddesign/2023/apr/09/new-allegations-of-plagiarism-against-roy-lichtenstein). De nouvelles allégations de plagiat ont été formulées à l'encontre de Roy Lichtenstein, un nouveau film affirmant que des centaines de ses œuvres peuvent être attribuées à d'autres artistes. Le documentaire affirme que plus de 30 artistes de bandes dessinées ont été "appropriés" par le fondateur du mouvement pop art, qui a gagné des millions en vendant ses œuvres, tandis que les artistes originaux qui ont été copiés ont vécu une vie austère, voire indigente. Alors que certains défendent le travail de Lichtenstein comme une "appropriation", les critiques le qualifient de vol, avec des "plagiats purs et simples" cités à côté d'œuvres "techniquement et artistiquement" supérieures copiées par Lichtenstein.

Discussion Service. De nouvelles allégations de plagiat à l'encontre de Roy Lichtenstein suscitent un débat sur l'éthique, l'originalité et la pertinence dans le monde de l'art. Les utilisateurs de Discussion Service débattent de la question de savoir si l'œuvre de Lichtenstein est transformatrice ou s'il s'agit d'un vol flagrant avec des changements minimes. Des questions de droits d'auteur et de propriété intellectuelle sont soulevées, ainsi que des questions relatives à la valeur culturelle accordée à la bande dessinée par rapport aux beaux-arts. Le débat porte notamment sur la nature de l'art, la création et la valeur dans le monde de l'art. Selon l'article, les premiers dessinateurs de bandes dessinées étaient souvent considérés comme des marchandises mal payées.