Aller au contenu principal

2024-10-11

2 $H100 : Comment la bulle de location de GPU a éclaté

  • Le marché des GPU a connu une baisse de prix significative, les GPU H100 passant de 8 $/h à moins de 2 $/h en raison d'une surabondance et de dynamiques de demande changeantes. Les facteurs contribuant à ce changement incluent la revente de calcul réservé, le réglage fin de modèles ouverts, et une réduction des nouvelles entreprises de modèles de base, rendant la location de GPU plus favorable que l'achat. L'émergence de modèles à poids ouvert et d'alternatives plus abordables, telles que les GPU AMD et Intel, influence le marché, avec un accent croissant sur l'inférence et le réglage fin de l'IA, soutenu par des plateformes comme Featherless.AI offrant des solutions d'IA rentables.

Réactions

  • Le marché de la location de GPU a connu une baisse de prix spectaculaire pour les GPU H100, passant de 8 $/h à 2 $/h, en raison d'une surabondance et d'une demande réduite de la part des nouvelles entreprises de modèles de base.
  • Cette réduction de prix a éclaté la bulle de location de GPU, affectant les investisseurs qui ont lourdement investi dans l'infrastructure GPU.
  • L'article explore le potentiel d'un paysage de l'IA plus accessible avec des options de calcul moins coûteuses, bien que la durabilité à long terme de ces bas prix et l'avenir de l'infrastructure de l'IA soient incertains.

Robotaxi Tesla

Réactions

  • Tesla a récemment présenté son Robotaxi, mettant en avant une vision pour les taxis autonomes qui contraste avec l'approche de Waymo, qui utilise du matériel coûteux comme le LiDAR. - Le design du Robotaxi, qui n'a pas de volant, indique un avenir dépendant de l'autonomie totale, bien qu'il fasse face à des défis réglementaires et technologiques. - La technologie Full Self-Driving (FSD) de Tesla est un sujet de débat, avec des critiques remettant en question sa préparation pour la conduite sans supervision et des partisans optimistes quant à son potentiel.

Commencez à désactiver les extensions installées utilisant encore le Manifest V2 dans la version stable de Chrome

  • Google supprime progressivement Manifest V2 pour les extensions Chrome, avec des avertissements et la désactivation de ces extensions commençant sur les canaux pré-stables à partir du 9 octobre 2024.
  • Les utilisateurs sont encouragés à passer aux alternatives de Manifest V3, les entreprises ayant jusqu'en juin 2025 pour effectuer la transition en utilisant la politique ExtensionManifestV2Availability.
  • Le processus de suppression progressive a commencé le 3 juin 2024, et le Chrome Web Store n'a pas accepté de nouvelles extensions Manifest V2 depuis juin 2022 pour les extensions privées et janvier 2022 pour les extensions publiques ou non répertoriées.

Réactions

  • Chrome passe des extensions Manifest V2 à Manifest V3, ce qui affecte les bloqueurs de publicités tels que uBlock Origin en limitant leurs capacités. - Alors que Chrome effectue cette transition, des navigateurs comme Firefox, Vivaldi et Brave ont l'intention de continuer à prendre en charge Manifest V2 pour le moment. - Ce changement a suscité des discussions sur le contrôle des utilisateurs et la confidentialité, certains utilisateurs envisageant de passer à des navigateurs alternatifs pour conserver des fonctionnalités de blocage des publicités efficaces.

Un compilateur Lisp vers RISC-V écrit en Lisp

  • uLisp est une version du langage de programmation Lisp conçue pour les microcontrôleurs, prenant en charge des plateformes comme Arduino, Raspberry Pi et ESP32. Il inclut des fonctionnalités telles que le débogage, l'interface de carte SD et les interfaces série I2C/SPI, avec des exemples pour des applications comme le clignotement de LED et l'enregistrement de données. Une caractéristique significative est le compilateur Lisp pour RISC-V, qui compile les fonctions Lisp en code machine, prenant en charge les fonctions récursives et l'optimisation des appels de queue pour une performance améliorée.

Réactions

  • Un compilateur Lisp pour RISC-V, écrit en Lisp, est en cours de développement mais manque de certaines opérations et fonctions pour être auto-compilant. - Le compilateur prend en charge les fonctions Lisp de base comme car et cdr, mais n'est pas encore complet. - uLisp est mis en avant pour sa simplicité et sa pertinence pour les microcontrôleurs, RISC-V étant une plateforme attrayante pour les passionnés de technologie et les hackers.

Le prix Nobel de la paix 2024 décerné à Nihon Hidankyo

  • Le prix Nobel de la paix 2024 a été décerné à Nihon Hidankyo, une organisation japonaise de survivants de la bombe atomique, connus sous le nom de Hibakusha, pour leur plaidoyer en faveur d'un monde sans nucléaire. Les Hibakusha ont contribué de manière significative à l'établissement du "tabou nucléaire", une norme mondiale contre l'utilisation des armes nucléaires, grâce à leurs témoignages percutants. Cette reconnaissance s'aligne avec la vision d'Alfred Nobel d'honorer les efforts qui bénéficient à l'humanité et continue d'inspirer de nouvelles générations vers le désarmement nucléaire.

Réactions

  • Le prix Nobel de la paix 2024 a été décerné à Nihon Hidankyo, une organisation japonaise plaidant contre les armes nucléaires, soulignant la menace persistante des armes nucléaires dans un contexte de tensions mondiales. - Ce prix sert de rappel de l'impact dévastateur de la guerre nucléaire, comme l'ont illustré Hiroshima et Nagasaki, et souligne l'importance du désarmement. - La discussion autour du prix implique également les complexités de la dissuasion nucléaire, du droit international et des dynamiques géopolitiques entre les puissances nucléaires.

Alternatives à WordPress

  • L'article a été mis à jour pour inclure davantage d'alternatives aux systèmes de gestion de contenu (CMS) en raison d'un intérêt accru, notamment à la lumière de la situation actuelle de WordPress. - La liste présente des options de CMS téléchargeables comme Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail et Textpattern, en excluant les CMS basés sur API et git. - Parmi les mentions notables, on trouve Ghost pour ses fonctionnalités d'email intégrées, Kirby pour son approche basée sur les fichiers, et ClassicPress en tant que fork de WordPress dirigé par la communauté, tandis que certains CMS comme Anchor ne sont plus maintenus.

Réactions

  • Jekyll sur GitHub Pages est recommandé pour les blogs simples utilisant Markdown, offrant une facilité d'utilisation sans nécessiter de configuration locale et permettant la portabilité du contenu sur différentes plateformes.
  • Les alternatives à WordPress pour le blogging incluent Chyrp Lite, Typecho, Quartz et Logseq, tandis que Drupal, ProcessWire et Wagtail offrent plus de flexibilité pour les développeurs.
  • Les générateurs de sites statiques tels qu'Astro et Publii deviennent de plus en plus populaires, et pour l'hébergement d'images, des options comme S3+Cloudfront ou CloudFlare sont suggérées.

Google Play a supprimé mon jeu et ne me dit pas pourquoi

  • Tukkun, un développeur de jeux indépendant, travaille sur "Anti-Idle: Reborn", qui a été approuvé par Google et Apple, et est en bêta fermée depuis un mois. - Le 7 octobre 2024, Google a résilié le compte de Tukkun en invoquant des "violations antérieures" et un "comportement à haut risque", sans fournir d'explication claire, impactant son travail et ses revenus. - Cette situation met en lumière un problème plus large où les développeurs subissent des résiliations de compte vagues, ce qui incite à demander plus de transparence et de clarté de la part de plateformes comme Google.

Réactions

  • Google Play a supprimé le jeu d'un développeur sans explication, soulignant le contrôle significatif que les entreprises technologiques exercent sur les développeurs.
  • Des incidents similaires ont été signalés avec Amazon et Google, où des comptes ou des applications sont bannis sans raisons claires ni support adéquat.
  • Les développeurs sont encouragés à diversifier leurs plateformes pour atténuer les risques, car cette situation met en lumière des préoccupations plus larges concernant le service client des géants de la technologie et les risques de dépendance liés à la construction d'entreprises sur leurs plateformes.

Nurdle Patrol

Réactions

  • En 2023, 221 conteneurs maritimes ont été perdus en mer, un nombre minime comparé aux 250 millions expédiés annuellement, ce qui souligne l'ampleur des opérations de transport maritime mondial.
  • Les granulés de plastique, appelés nurdles, sont des polluants visibles sur les plages et peuvent se dégrader en microplastiques, entrant ainsi dans la chaîne alimentaire et posant un danger potentiel, bien qu'ils ne soient pas la principale source de pollution plastique marine.
  • La discussion sur la pollution plastique souligne sa complexité et son impact mondial, y compris l'exportation des problèmes de déchets des pays développés vers les pays en développement et l'adaptation potentielle des écosystèmes à la pollution plastique, ce qui suscite des inquiétudes quant à l'utilisation future du plastique.

Leçons initiales sur les performances CUDA

  • Malte Skarupke parle de son expérience d'apprentissage de CUDA, notant qu'il s'agit essentiellement de C++ avec des fonctionnalités supplémentaires pour le calcul parallèle.
  • Les leçons clés pour optimiser les performances CUDA incluent la coalescence de la mémoire, la compréhension des différents types de mémoire, et la maximisation du parallélisme en utilisant de nombreux threads et en séparant les tâches en différents noyaux.
  • Skauprke souligne que l'écriture de CUDA est semblable à la résolution d'un puzzle, où l'accent principal devrait être mis sur l'exécution des tâches en parallèle avant d'optimiser pour la vitesse.

Réactions

  • Les discussions portent sur l'optimisation du code CUDA pour la performance des GPU, spécifiquement pour un déclencheur d'expérience du LHC (Grand collisionneur de hadrons), en gérant les registres, la mémoire partagée et les blocs de threads.
  • Il met en évidence les compromis entre l'occupation (le nombre de threads actifs), l'utilisation des registres et les latences de mémoire, soulignant l'évolution des contraintes de programmation en CUDA.
  • Cette conversation compare les performances des GPU et des CPU, en notant les différences en termes de consommation d'énergie et de capacités de calcul, et souligne l'importance de trouver un équilibre entre l'occupation et la performance pour les avancées futures du matériel et des logiciels.

Le FBI a créé une pièce pour enquêter sur les stratagèmes de pompage et de déversement de crypto-monnaies.

  • Le FBI a développé une cryptomonnaie basée sur Ethereum, NexFundAI, pour enquêter et exposer les stratagèmes de pompage et de déversement de crypto, conduisant à des actions judiciaires significatives. Des accusations ont été portées contre 18 individus et entités pour fraude et manipulation de marché, la Securities and Exchange Commission ciblant trois teneurs de marché et neuf autres pour avoir gonflé les prix des actifs cryptographiques. Le Département de la Justice a réussi à récupérer 25 millions de dollars de produits frauduleux, qui seront restitués aux investisseurs, soulignant l'efficacité de l'opération dans la lutte contre la fraude crypto.

Réactions

  • Le FBI a développé une cryptomonnaie pour enquêter sur les stratagèmes de pump-and-dump, qui sont des pratiques frauduleuses consistant à gonfler artificiellement le prix d'un actif avant de le vendre.
  • Cette initiative a déclenché des débats sur le piège et les implications éthiques de l'application de la loi créant des titres contrefaits.
  • Les discussions s'étendent à des préoccupations plus larges concernant la légitimité des cryptomonnaies et le rôle du gouvernement dans la régulation des monnaies numériques.

NotesHub : application de prise de notes multiplateforme basée sur Markdown

  • Cette application est disponible sur plusieurs plateformes, y compris iOS, Android, Windows, Mac, Apple Vision Pro et le Web, la version Web étant une application Web progressive gratuite qui fonctionne hors ligne. Les notes peuvent être stockées dans des dépôts Git, avec la meilleure intégration avec GitHub, et prennent également en charge des options auto-hébergées comme Gitea, les systèmes de fichiers ou iCloud Drive. L'application prend en charge une syntaxe Markdown enrichie avec des extensions pour créer des tableaux Kanban, des tableaux blancs basés sur Excalidraw, et inclut des fonctionnalités comme la notation musicale Mermaid et ABC.

Réactions

  • NotesHub est une application de prise de notes polyvalente basée sur Markdown, disponible sur plusieurs plateformes, y compris iOS, Android, Windows, Mac, Apple Vision Pro et le Web. - L'application propose une version gratuite en Progressive Web App, tandis que les versions natives nécessitent un paiement unique, avec une forte intégration pour stocker les notes dans des dépôts Git comme GitHub, GitLab ou Bitbucket. - Elle offre une syntaxe Markdown riche, des tableaux Kanban et des tableaux blancs basés sur Excalidraw, les utilisateurs louant son design épuré et ses capacités hors ligne, bien qu'elle ne soit pas open-source et ait un support limité pour Linux.

Interrupteur de sécurité sans dépendance à votre infrastructure

  • Un nouveau projet Go, Deadcheck, a été développé pour fonctionner comme un interrupteur de sécurité sans dépendre des tâches cron, des minuteries ou des bases de données. Deadcheck s'intègre à PagerDuty, une plateforme de gestion des incidents populaire, pour maintenir les incidents en veille jusqu'à ce qu'un enregistrement soit manqué, moment auquel il déclenche une alerte. Ce projet se distingue par son approche innovante de la gestion des alertes et des incidents sans dépendances traditionnelles de planification ou de base de données.

Réactions

  • Deadcheck est un projet Go conçu comme un interrupteur de sécurité, éliminant le besoin de tâches cron ou de bases de données, et s'intègre avec PagerDuty pour gérer les alertes.
  • Le projet a suscité des discussions sur les interrupteurs de l'homme mort, y compris les aspects juridiques et les solutions alternatives telles que l'utilisation d'avocats ou de systèmes blockchain.
  • Les utilisateurs ont suggéré des services existants comme Cronitor ou OpsGenie pour des fonctionnalités similaires, et le projet prévoit d'étendre les intégrations au-delà de PagerDuty.

Comprendre les limites du raisonnement mathématique dans les grands modèles de langage

  • Le document « GSM-Symbolic » par Iman Mirzadeh et al. examine les capacités de raisonnement mathématique des grands modèles de langage (LLMs) en utilisant le benchmark GSM8K. - Les auteurs introduisent GSM-Symbolic, un nouveau benchmark avec des modèles symboliques, montrant que les LLMs ont du mal avec les variations des valeurs numériques et les clauses supplémentaires dans les questions. - L'étude suggère que les LLMs peuvent reproduire le raisonnement à partir des données d'entraînement plutôt que de réaliser un véritable raisonnement logique, soulignant leurs limites en matière de raisonnement mathématique.

Réactions

  • Les grands modèles de langage (LLM) rencontrent des défis en matière de raisonnement mathématique, en particulier lorsque les problèmes incluent des informations non pertinentes, ce qui affecte leur performance. - Cette limitation souligne la dépendance des LLM à la reconnaissance de motifs plutôt qu'au raisonnement logique, les rendant moins efficaces dans des scénarios réels avec des détails superflus. - Malgré les avancées, les LLM ont encore du mal à distinguer les informations importantes du bruit, une compétence essentielle pour les applications pratiques.

ARIA : Un modèle expert en mélange natif multimodal ouvert

  • Aria est un modèle d'IA natif multimodal ouvert qui intègre diverses informations du monde réel pour une compréhension complète, surpassant des modèles comme Pixtral-12B et Llama3.2-11B en termes de performance. C'est un modèle à mélange d'experts avec 3,9 milliards et 3,5 milliards de paramètres activés par jeton visuel et textuel, respectivement, améliorant ses capacités linguistiques et multimodales. Les poids et la base de code du modèle sont en open source, facilitant une adoption et une adaptation aisées par les développeurs et les chercheurs.

Réactions

  • ARIA est un nouveau modèle multimodal natif Mixture-of-Experts (MoE) qui dépasse Pixtral-12B et Llama3.2-11B en termes de performance et de vitesse d'inférence en utilisant efficacement des paramètres actifs. Bien qu'il ait une utilisation de mémoire similaire à un modèle de 25B, ARIA fonctionne comme un modèle de 10B et opère aussi rapidement qu'un modèle de 4B, ce qui le rend adapté aux appareils avec une mémoire adéquate, comme un M2 Max. Les experts du modèle se concentrent sur la syntaxe, avec une marge d'amélioration dans la sélection des experts, et il est actuellement disponible pour des tests, bien que certains utilisateurs aient rencontré des problèmes de plateforme.