2024-05-21

Scarlett Johansson répond à la controverse sur la voix "Sky" d'OpenAI

Scarlett Johansson a publié une déclaration sur la situation d'OpenAI, partagée par le journaliste Bobby Allyn sur Twitter le 20 mai 2024.
L'implication d'une célébrité de premier plan comme Johansson a attiré l'attention du public sur cette question.
Les détails de la déclaration de Johansson et la nature de la situation d'OpenAI n'ont pas été précisés dans le texte fourni.

Réactions

Scarlett Johansson a décliné la demande d'OpenAI d'utiliser sa voix pour leur fonction "Sky", mais ils ont utilisé une version clonée sans son consentement dans une démo, ce qui a conduit à son retrait après une intervention juridique.
Cet incident a suscité des critiques à l'encontre du PDG Sam Altman, accusé de pratiques contraires à l'éthique, et a soulevé des inquiétudes quant à la transparence et à la responsabilité des dirigeants de l'industrie technologique.
La controverse souligne la nécessité du consentement et les risques juridiques et de relations publiques potentiels liés à l'utilisation de l'image d'une célébrité sans autorisation explicite.

Enlightenmentware : Le voyage d'un programmeur à travers UNIX, Git, Emacs et Bazel

Le billet de blog se penche sur les "enlightenmentware", des logiciels qui façonnent de manière significative l'approche de la conception du système d'un programmeur.
L'auteur partage son parcours avec UNIX, les systèmes de contrôle de version comme Git, et sa transition de Vim à Emacs, en soulignant l'extensibilité d'Emacs et son architecture basée sur le langage Lisp.
Ils soulignent la valeur éducative de la bibliothèque Boost Graph, leur préférence pour les systèmes de construction Blaze et Bazel de Google, et plaident en faveur d'outils simples et puissants qui résolvent des problèmes fondamentaux.

Réactions

La discussion met en lumière divers outils logiciels et systèmes d'exploitation, en se concentrant sur leurs rôles dans la vérification du code, l'optimisation et l'apprentissage interactif, avec des outils tels que Compiler Explorer, Jupyter Notebooks, et Python Tutor notés pour leurs avantages éducatifs.
Les utilisateurs comparent Windows, Linux et macOS pour les tâches techniques, discutant de la convivialité et de la personnalisation, tandis que Docker et Podman sont loués pour leur facilité d'installation et leur impact minimal sur le système, et que NixOS est reconnu pour sa personnalisation et sa gestion de la configuration malgré une courbe d'apprentissage abrupte.
La conversation couvre une gamme d'outils de développement de logiciels, y compris Buck2, Docker, JUnit et TypeScript, et souligne l'importance d'une utilisation innovante des outils et de trouver les bons outils pour les besoins et les préférences de chacun.

La proposition de surveillance "Chat Control" de l'UE est rejetée pour des raisons de protection de la vie privée

L'initiative "Going Dark", dirigée par la commissaire européenne Ylva Johansson, propose des mesures de surveillance étendues utilisant l'IA pour contrôler toutes les communications sous couvert de lutte contre les abus sexuels sur les enfants.
La proposition, connue sous le nom de "Chat Control", s'est heurtée à une forte opposition de la part d'organismes tels que le Conseil de protection des données du Parlement européen et le Conseil des droits de l'homme des Nations unies, au motif qu'elle violait les lois sur les droits de l'homme, ce qui a conduit à son rejet.
La Cour européenne de justice s'est prononcée contre l'accès aux communications cryptées, soulignant les inquiétudes concernant la protection de la vie privée, la surveillance de masse et l'ingérence des gouvernements.

Réactions

Une proposition de loi européenne vise à renforcer la surveillance par la mise sur écoute des messages des citoyens, tout en exemptant les politiciens et la police, ce qui soulève d'importantes préoccupations en matière de protection de la vie privée.
Les critiques comparent le projet de loi au "1984" d'Orwell, mettant en garde contre une autorité incontrôlée et l'érosion de la vie privée, en particulier compte tenu du caractère indispensable des smartphones et des médias sociaux pour les services essentiels.
Le débat porte notamment sur le chiffrement de bout en bout (E2EE), l'ingérence des pouvoirs publics, l'utilisation abusive de l'IA, la sécurité des données et l'équilibre entre vie privée et sécurité, reflétant une perspective libertaire sceptique à l'égard des intentions des pouvoirs publics.

Comprendre la densité de l'interface utilisateur : Concevoir des interfaces modernes pour un flux d'informations optimal

Les sites web et les applications modernes de 2024 sont moins denses visuellement que ceux des années 2000, ce qui signifie qu'ils apparaissent plus dispersés.
La densité de l'interface utilisateur ne concerne pas seulement l'aspect visuel, mais aussi la quantité d'informations transmises au fil du temps et la manière dont les décisions en matière de conception augmentent la valeur du logiciel.
Parmi les exemples d'interfaces visuellement denses, on peut citer le terminal de Bloomberg, qui affiche de nombreuses données sur les marchés, et Craigslist, connu pour ses nombreux liens simples et ses fonctions de recherche simples.

Réactions

L'article aborde les défis liés à la conception d'interfaces utilisateur (IU) pour différentes densités d'écran, en particulier avec des technologies telles que React, et met en évidence des problèmes tels que la mauvaise mise à l'échelle et le défilement sur les écrans plus petits.
Il critique l'utilisation abusive de cadres tels que React, souligne la nécessité de meilleures pratiques de conception pour garantir l'accessibilité et la facilité d'utilisation sur tous les appareils, et examine l'équilibre entre la densité de l'information et la compréhension de l'utilisateur.
La discussion oppose les conceptions d'applications occidentales et asiatiques, critique les pratiques d'interface utilisateur contraires à l'éthique et souligne l'importance d'un équilibre entre fonctionnalité et lisibilité, tout en explorant les défis du responsive web design (RWD) et son impact sur l'expérience de l'utilisateur.

Le "Shipbreaking" d'Edward Burtynsky capture la beauté obsédante du recyclage industriel

Le projet "Shipbreaking" d'Edward Burtynsky examine le démantèlement de grands navires, inspiré par la mise hors service de navires à simple coque après la marée noire de l'Exxon Valdez.
Les photographies, prises en Inde et au Bangladesh, présentent le processus industriel comme une forme de recyclage ultime, soulignant l'impact des activités industrielles sur l'environnement.
L'œuvre de Burtynsky suggère une beauté obsédante dans ces scènes, laissant entendre que la nature peut finalement reconquérir les paysages altérés par l'activité humaine.

Réactions

Le fil conducteur traite de l'industrie du démantèlement des navires, en mettant en évidence les conditions de travail difficiles, l'impact sur l'environnement et les dilemmes éthiques.
Les utilisateurs partagent des anecdotes personnelles, des comparaisons historiques et des références médiatiques, notamment le jeu "Hardspace : Shipbreaker" et des œuvres de photographes et d'auteurs.
Des questions plus larges telles que l'exploitation du travail au niveau mondial, les réglementations environnementales et les complexités de la gestion des déchets au niveau international sont également explorées.

NoTunes : Empêcher Apple Music de se lancer automatiquement sur macOS

noTunes est une application macOS qui empêche le lancement d'iTunes ou d'Apple Music. Une nouvelle mise à jour (version 3.2 ou ultérieure) est nécessaire en raison de l'expiration d'un certificat.
L'application peut être installée via Homebrew ou par téléchargement direct, et elle offre des fonctionnalités telles que le lancement au démarrage, l'activation/désactivation via la barre de menu, et la définition d'une application ou d'un site web de remplacement.
noTunes est disponible sous la licence MIT, ce qui en fait un logiciel libre et gratuit pour les utilisateurs et les développeurs.

Réactions

NoTunes est une application macOS conçue pour empêcher Apple Music de se lancer automatiquement, à l'intention des utilisateurs de Spotify frustrés par le comportement par défaut d'Apple Music.
La discussion révèle des frustrations plus larges à l'égard de l'écosystème d'Apple, telles que le lancement automatique d'applications, les fonctions intrusives et le contrôle limité de l'utilisateur, ce qui entraîne des problèmes tels que la lecture automatique non désirée et des préoccupations concernant le partage des données.
Les utilisateurs discutent également de leurs préférences en matière de matériel, recommandant des alternatives aux ordinateurs portables Asus et HP en raison de problèmes de durabilité, et expriment des sentiments mitigés à l'égard de macOS, Windows et Linux, soulignant l'absence d'historique intégré dans le presse-papiers de macOS et la mauvaise gestion des périphériques Bluetooth.

Caméléon : La percée de Meta dans l'intégration modale mixte de l'IA

L'article "Caméléon : Mixed-Modal Early-Fusion Foundation Models" présente Chameleon, une famille de modèles intégrant des images et du texte à l'aide d'une approche de fusion précoce basée sur les jetons.
Chameleon excelle dans des tâches telles que la réponse à des questions visuelles, le sous-titrage d'images et la génération de modes mixtes, atteignant des performances de pointe dans le sous-titrage d'images et surpassant Llama-2 dans les tâches textuelles uniquement.
Il rivalise et dépasse souvent les performances de modèles plus importants tels que Mixtral 8x7B, Gemini-Pro et GPT-4V dans les évaluations humaines, marquant ainsi une avancée significative dans la modélisation unifiée de documents multimodaux.

Réactions

Le nouveau modèle multimodal de Meta, Chameleon, a fait des progrès significatifs dans le traitement de la tokenisation et de la dynamique concurrentielle entre les modalités depuis sa création il y a cinq mois.
Le développement de Chameleon, qui nécessite des ressources informatiques considérables, soulève des inquiétudes quant à la durabilité de l'IA à code source ouvert en raison des coûts élevés et de la dépendance à l'égard des entreprises.
Les solutions potentielles à ces défis comprennent l'amélioration de l'efficacité informatique, la spécialisation des modèles et la formation distribuée, avec des comparaisons continues avec d'autres modèles comme le Mirasol3B de Google et des discussions sur le traitement unifié ou séparé des modalités.

Comprendre Xterm : Entrée utilisateur et mécanique du terminal (Partie 1)

Cette série de blogs explore les mécanismes des terminaux modernes et des outils de ligne de commande sous Linux, en se concentrant sur les fonctionnalités de xterm et de tty par le biais d'expériences pratiques et de débogage.
Il couvre l'interaction de l'utilisateur avec xterm, la communication avec l'interpréteur de commandes, les processus d'arrière-plan, le contrôle d'accès et le traitement des entrées au clavier, en utilisant des outils comme strace, showkey et xev pour le débogage.
La série comprend des exemples pratiques pour tracer les appels système, analyser le comportement des terminaux et comprendre les caractères non imprimables, le codage UTF-8 et l'identification des caractères ASCII/multi-octets, destinés à ceux qui développent des outils de ligne de commande.

Réactions

L'article "Comment fonctionne un terminal. Part 1 : Xterm, user input" se penche sur les fonctionnalités des émulateurs de terminal, en se concentrant sur Xterm et la gestion des entrées utilisateur.
Il couvre des aspects historiques, tels que les connexions en majuscules dues aux limitations des premiers terminaux, et l'évolution des protocoles des terminaux, en soulignant leurs complexités et leurs limites.
La discussion porte notamment sur la question de savoir si les terminaux doivent rester de simples outils textuels ou s'ils doivent évoluer pour prendre en charge des interactions plus complexes, en mentionnant des solutions modernes telles que les systèmes à interface graphique et les extensions de terminaux comme Kitty.

CADmium : La CAO par navigateur open-source avec Rust et WebAssembly recherche le soutien de la communauté

CADmium est un programme de CAO open-source, basé sur un navigateur, en cours de développement, qui recherche le soutien de la communauté via Discord.
Le projet vise à utiliser un simulateur de physique 2D pour la résolution des contraintes et présente "Truck", un noyau b-rep moderne en Rust, offrant une sécurité mémoire et une compatibilité web.
CADmium propose une stratégie de modélisation résiliente (RMS) pour une meilleure réutilisation de la conception et recherche de l'aide pour la programmation Rust, la géométrie computationnelle, les améliorations de Three.js et le financement.

Réactions

CADmium est un nouveau programme de CAO local basé sur un navigateur et utilisant le noyau paramétrique Truck. Il vise à fournir une alternative libre aux logiciels de CAO commerciaux tels que SolidWorks.
Le projet a suscité l'enthousiasme en raison du potentiel de Truck à surmonter les limitations des autres noyaux, mais des inquiétudes subsistent quant au passage éventuel à un modèle d'abonnement et au maintien d'une approche locale d'abord.
Les discussions mettent en évidence la complexité de la mise en œuvre des filets, le suivi de la référence des bords et le potentiel de Rust et de WASM pour les applications de CAO, avec une innovation significative observée dans les logiciels de CAO à code source ouvert comme FreeCAD.

Erlang/OTP 27 : Docs Markdown, chaînes de caractères à triple quotient et outils de profilage améliorés

Erlang/OTP 27 introduit un système de documentation remanié utilisant Markdown et ExDoc, améliorant la cohérence en intégrant la documentation dans le code source.
Parmi les principales caractéristiques, citons les chaînes à triple quotient pour faciliter la gestion des textes multilignes, les sigils pour une meilleure gestion des chaînes littérales, un nouveau module JSON, les étiquettes de processus et l'agrafage SSL côté client amélioré.
Parmi les autres mises à jour, citons les sessions de trace multiples, la prise en charge de la couverture native, un nouvel outil de profilage (tprof), de nouvelles fonctions de temporisation, des améliorations de l'ETS (Erlang Term Storage) et l'abandon des archives en raison de problèmes de performances.

Réactions

Erlang/OTP 27 est mis en avant pour son modèle de concurrence supérieur, ses processus légers et sa gestion robuste des erreurs, ce qui le rend efficace pour les logiciels distribués par rapport aux langages traditionnels tels que C++, C# et Python.
La nouvelle documentation Erlang 27, qui adopte le système Elixir et s'intègre à des langages comme Gleam, est bien accueillie, l'adoption d'ExDoc étant considérée comme une amélioration significative.
Malgré ses atouts, le manque de typage statique d'Erlang est considéré comme un inconvénient potentiel pour les performances et la maintenabilité dans les grands projets.

Réimaginer l'apprentissage : L'IA, l'éducation par projet et l'avenir du tutorat personnalisé

Le texte souligne l'importance des activités immersives et significatives par rapport aux méthodes d'apprentissage traditionnelles, et préconise un équilibre entre l'apprentissage fondé sur la découverte et l'apprentissage structuré.
Il met en évidence le potentiel de l'IA pour fournir un soutien éducatif personnalisé et riche en contexte, intégrant des conseils en temps réel et des médias dynamiques pour améliorer l'apprentissage et la rétention de la mémoire.
Les préoccupations éthiques concernant l'IA dans l'éducation sont soulevées, et l'on préconise une approche exploratoire menée par les étudiants, comme cela a été discuté dans l'exposé d'Andy Matuschak "How might we learn" (Comment pouvons-nous apprendre ?) à l'occasion de Design@Large de l'UCSD.

Réactions

La discussion critique les limites de l'IA actuelle, en particulier les grands modèles linguistiques tels que GPT-4, dans les environnements éducatifs en raison des taux d'erreur élevés et des résultats trompeurs.
Il explore les avantages et les inconvénients des systèmes de répétition espacée tels qu'Anki pour la rétention de la mémoire, notant leur efficacité pour la mémorisation mais leurs lacunes potentielles pour favoriser la compréhension en profondeur.
Le débat plaide en faveur d'approches plus intuitives et centrées sur l'humain dans l'éducation et la conception de logiciels, soulignant la nécessité pour la technologie d'autonomiser et de connecter les gens, tout en répondant aux préoccupations relatives à la confidentialité des données.

Gifski : GIFs de haute qualité avec options avancées d'encodage et d'intégration

Gifski est un encodeur GIF de haute qualité basé sur pngquant, qui convertit les images vidéo en GIF avec des palettes croisées efficaces et un tramage temporel, ce qui permet d'obtenir des milliers de couleurs par image.
Il s'agit principalement d'un outil en ligne de commande, mais il peut être compilé en tant que bibliothèque C pour être intégré dans d'autres applications. Les exécutables peuvent être téléchargés ou installés via Homebrew ou Rust's cargo.
L'outil nécessite l'exportation d'images vidéo au format PNG, offre des options de redimensionnement et d'ajustement de la qualité, et prend en charge la création de bibliothèques dynamiques avec cargo-c, sous licence AGPL 3 ou ultérieure, avec d'autres options de licence.

Réactions

Gifski est un encodeur GIF optimisé connu pour sa facilité d'intégration et ses paramètres par défaut efficaces, réduisant le besoin d'étapes d'optimisation supplémentaires.
Les utilisateurs apprécient la capacité de Gifski à construire des binaires statiques, ce qui facilite l'inclusion d'applications.
La discussion porte notamment sur l'utilisation des GIF par rapport aux formats modernes tels que WebM et PNG animés, certains utilisateurs préférant ces derniers pour leur meilleure qualité et leurs fonctionnalités, bien que les GIF restent populaires pour des cas d'utilisation spécifiques tels que les readmes de GitHub.