Saltar al contenido principal

2024-10-11

2 dólares H100s: Cómo estalló la burbuja del alquiler de GPU

  • El mercado de GPUs ha experimentado una caída significativa en los precios, con las GPUs H100 disminuyendo de $8/h a menos de $2/h debido a un exceso de oferta y cambios en la dinámica de la demanda. Los factores que contribuyen a este cambio incluyen la reventa de computación reservada, el ajuste fino de modelos abiertos y una reducción en las nuevas empresas de modelos base, lo que hace que alquilar GPUs sea más favorable que comprarlas. La aparición de modelos de peso abierto y alternativas más asequibles, como las GPUs de AMD e Intel, está influyendo en el mercado, con un énfasis creciente en la inferencia de IA y el ajuste fino, respaldado por plataformas como Featherless.AI que ofrecen soluciones de IA rentables.

Reacciones

  • La caída dramática de precios en el mercado de alquiler de GPU para las H100, de $8/h a $2/h, se debe a un exceso de oferta y a la disminución de la demanda por parte de nuevas empresas de modelos fundacionales.
  • Esta reducción de precios ha estallado la burbuja del alquiler de GPU, afectando a los inversores que invirtieron fuertemente en infraestructura de GPU.
  • El artículo explora el potencial de un panorama de IA más accesible con opciones de computación más económicas, aunque la sostenibilidad a largo plazo de estos precios bajos y el futuro de la infraestructura de IA son inciertos.

Tesla Robotaxi

Reacciones

  • Recientemente, Tesla presentó su Robotaxi, destacando una visión para taxis autónomos que contrasta con el enfoque de Waymo, que utiliza hardware costoso como LiDAR. El diseño del Robotaxi, que carece de volante, indica un futuro dependiente de la autonomía total, aunque enfrenta desafíos regulatorios y tecnológicos. La tecnología de Conducción Autónoma Completa (FSD) de Tesla es un tema de debate, con críticos que cuestionan su preparación para la conducción sin supervisión y partidarios optimistas sobre su potencial.

Comience a deshabilitar las extensiones instaladas que aún utilizan Manifest V2 en Chrome estable

  • Google está eliminando gradualmente Manifest V2 para las extensiones de Chrome, con advertencias y desactivación de estas extensiones comenzando en los canales pre-estables a partir del 9 de octubre de 2024.
  • Se alienta a los usuarios a hacer la transición a alternativas de Manifest V3, y las empresas tienen hasta junio de 2025 para completar la transición utilizando la política ExtensionManifestV2Availability.
  • La eliminación gradual comenzó el 3 de junio de 2024, y la Chrome Web Store no ha aceptado nuevas extensiones de Manifest V2 desde junio de 2022 para privadas y enero de 2022 para extensiones públicas o no listadas.

Reacciones

  • Chrome está haciendo la transición de extensiones de Manifest V2 a Manifest V3, lo que afecta a los bloqueadores de anuncios como uBlock Origin al limitar sus capacidades. Mientras Chrome realiza este cambio, navegadores como Firefox, Vivaldi y Brave tienen la intención de seguir apoyando Manifest V2 por el momento. Este cambio ha provocado discusiones sobre el control del usuario y la privacidad, con algunos usuarios contemplando cambiar a navegadores alternativos para mantener funciones efectivas de bloqueo de anuncios.

Un compilador de Lisp a RISC-V escrito en Lisp

  • uLisp es una versión del lenguaje de programación Lisp diseñada para microcontroladores, compatible con plataformas como Arduino, Raspberry Pi y ESP32. Incluye características como depuración, interfaz de tarjeta SD e interfaces seriales I2C/SPI, con ejemplos para aplicaciones como parpadeo de LED y registro de datos. Una característica significativa es el compilador de Lisp para RISC-V, que compila funciones Lisp en código máquina, admitiendo funciones recursivas y optimización de llamadas en cola para mejorar el rendimiento.

Reacciones

  • Un compilador de Lisp para RISC-V, escrito en Lisp, está en desarrollo pero carece de ciertas operaciones y funciones para ser auto-compilable. El compilador admite funciones básicas de Lisp como car y cdr, pero aún no está completo. Se destaca uLisp por su simplicidad y adecuación para microcontroladores, siendo RISC-V una plataforma atractiva para entusiastas de la tecnología y hackers.

Nobel de la Paz 2024 otorgado a Nihon Hidankyo

  • La organización japonesa Nihon Hidankyo, compuesta por sobrevivientes de la bomba atómica conocidos como Hibakusha, ha sido galardonada con el Premio Nobel de la Paz 2024 por su defensa de un mundo libre de armas nucleares. Los Hibakusha han contribuido significativamente a establecer el "tabú nuclear", una norma global contra el uso de armas nucleares, a través de sus testimonios impactantes. Este reconocimiento se alinea con la visión de Alfred Nobel de honrar los esfuerzos que benefician a la humanidad y continúa inspirando a nuevas generaciones hacia el desarme nuclear.

Reacciones

  • La Premio Nobel de la Paz 2024 fue otorgado a Nihon Hidankyo, una organización japonesa que aboga contra las armas nucleares, subrayando la amenaza persistente de las armas nucleares en medio de tensiones globales. Este premio sirve como un recordatorio del impacto devastador de la guerra nuclear, como lo ejemplifican Hiroshima y Nagasaki, y enfatiza la importancia del desarme. La discusión sobre el premio también involucra las complejidades de la disuasión nuclear, el derecho internacional y las dinámicas geopolíticas entre las potencias nucleares.

Alternativas a WordPress

  • La actualización del artículo incluye más alternativas de Sistemas de Gestión de Contenidos (CMS) debido al creciente interés, especialmente a la luz de la situación actual de WordPress. La lista presenta opciones de CMS descargables como Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail y Textpattern, excluyendo los CMS basados en API y git. Menciones notables incluyen a Ghost por sus características de correo electrónico integradas, Kirby por su enfoque basado en archivos y ClassicPress como un fork de WordPress liderado por la comunidad, mientras que algunos CMS como Anchor ya no se mantienen.

Reacciones

  • Jekyll en GitHub Pages se recomienda para blogs simples que utilizan Markdown, ofreciendo facilidad de uso sin requerir configuración local y permitiendo la portabilidad de contenido a través de plataformas.
  • Las alternativas a WordPress para blogs incluyen Chyrp Lite, Typecho, Quartz y Logseq, mientras que Drupal, ProcessWire y Wagtail ofrecen más flexibilidad para los desarrolladores.
  • Los generadores de sitios estáticos como Astro y Publii están ganando popularidad, y para el alojamiento de imágenes, se sugieren opciones como S3+Cloudfront o CloudFlare.

Google Play eliminó mi juego y no me dirá por qué

  • Tukkun, un desarrollador de juegos indie, ha estado trabajando en "Anti-Idle: Reborn", que fue aprobado por Google y Apple, y ha estado en Beta Cerrada durante un mes. El 7 de octubre de 2024, Google terminó la cuenta de Tukkun citando "violaciones previas" y "comportamiento de alto riesgo", pero no proporcionó una explicación clara, afectando su trabajo e ingresos. Esta situación resalta un problema más amplio donde los desarrolladores experimentan terminaciones de cuentas vagas, lo que provoca llamados a una mayor transparencia y claridad por parte de plataformas como Google.

Reacciones

  • Google Play eliminó el juego de un desarrollador sin explicación, lo que subraya el control significativo que las empresas tecnológicas tienen sobre los desarrolladores.
  • Se han reportado incidentes similares con Amazon y Google, donde cuentas o aplicaciones son prohibidas sin razones claras o soporte adecuado.
  • Se anima a los desarrolladores a diversificar sus plataformas para mitigar riesgos, ya que esta situación resalta preocupaciones más amplias sobre el servicio al cliente de los gigantes tecnológicos y los riesgos de dependencia al construir negocios en sus plataformas.

Nurdle Patrol

Reacciones

  • En 2023, se perdieron 221 contenedores de envío en el mar, un número menor en comparación con los 250 millones enviados anualmente, lo que resalta la magnitud de las operaciones de envío global.
  • Los gránulos de plástico, conocidos como nurdles, son contaminantes visibles en las playas y pueden degradarse en microplásticos, ingresando a la cadena alimentaria y representando un daño potencial, aunque no son la fuente principal de contaminación plástica marina.
  • La discusión sobre la contaminación por plásticos enfatiza su complejidad e impacto global, incluyendo la exportación de problemas de desechos de países desarrollados a países en desarrollo y la posible adaptación de los ecosistemas a la contaminación por plásticos, lo que genera preocupaciones sobre el uso futuro de plásticos.

Iniciales lecciones de rendimiento de CUDA

  • Malte Skarupke habla sobre su experiencia aprendiendo CUDA, señalando que es esencialmente C++ con características adicionales para la computación en paralelo.
  • Las lecciones clave para optimizar el rendimiento de CUDA incluyen la coalescencia de memoria, la comprensión de los diversos tipos de memoria y la maximización del paralelismo mediante el uso de muchos hilos y la separación de tareas en diferentes núcleos.
  • Skaupke enfatiza que escribir CUDA es similar a resolver un rompecabezas, donde el enfoque principal debe estar en ejecutar tareas en paralelo antes de optimizar para la velocidad.

Reacciones

  • La discusión se centra en optimizar el código CUDA para el rendimiento de la GPU, específicamente para un disparador de experimento del LHC (Gran Colisionador de Hadrones), mediante la gestión de registros, memoria compartida y bloques de hilos.
  • Destaca los compromisos entre la ocupación (el número de hilos activos), el uso de registros y las latencias de memoria, subrayando la evolución de las restricciones de programación en CUDA.
  • La conversación compara el rendimiento de GPU y CPU, señalando diferencias en el consumo de energía y las capacidades computacionales, y enfatiza la importancia de equilibrar la ocupación y el rendimiento para futuros avances en hardware y software.

La FBI creó una moneda para investigar esquemas de bombeo y descarga de criptomonedas

  • La FBI desarrolló una criptomoneda basada en Ethereum, NexFundAI, para investigar y exponer esquemas de bombeo y descarga de criptomonedas, lo que llevó a acciones legales significativas. Se presentaron cargos contra 18 individuos y entidades por fraude y manipulación del mercado, con la Comisión de Bolsa y Valores apuntando a tres creadores de mercado y nueve más por inflar los precios de los activos criptográficos. El Departamento de Justicia recuperó con éxito $25 millones en ganancias fraudulentas, que serán devueltos a los inversores, destacando la efectividad de la operación en la lucha contra el fraude criptográfico.

Reacciones

  • La FBI desarrolló una criptomoneda para investigar esquemas de bombeo y descarga, que son prácticas fraudulentas que inflan artificialmente el precio de un activo antes de venderlo.
  • Esta iniciativa ha encendido debates sobre la trampa y las implicaciones éticas de que las fuerzas del orden creen valores falsificados.
  • La discusión se extiende a preocupaciones más amplias sobre la legitimidad de las criptomonedas y el papel del gobierno en la regulación de las monedas digitales.

NotesHub: aplicación de toma de notas multiplataforma basada en Markdown

  • La aplicación está disponible en múltiples plataformas, incluidas iOS, Android, Windows, Mac, Apple Vision Pro y la Web, siendo la versión web una aplicación web progresiva gratuita que funciona sin conexión. Las notas se pueden almacenar en repositorios Git, con la mejor integración con GitHub, y también admite opciones autoalojadas como Gitea, sistemas de archivos o iCloud Drive. La aplicación admite una rica sintaxis Markdown con extensiones para crear tableros Kanban, pizarras basadas en Excalidraw, e incluye características como notación musical Mermaid y ABC.

Reacciones

  • NotesHub es una aplicación versátil para tomar notas basada en Markdown, disponible en múltiples plataformas, incluyendo iOS, Android, Windows, Mac, Apple Vision Pro y la Web. La aplicación ofrece una versión gratuita de Progressive Web App, mientras que las versiones nativas requieren un pago único, con una fuerte integración para almacenar notas en repositorios Git como GitHub, GitLab o Bitbucket. Cuenta con una rica sintaxis de Markdown, tableros Kanban y pizarras basadas en Excalidraw, con usuarios que elogian su diseño limpio y capacidades offline, aunque no es de código abierto y tiene soporte limitado para Linux.

Interruptor de hombre muerto sin depender de su infraestructura

  • Un nuevo proyecto en Go, Deadcheck, ha sido desarrollado para funcionar como un interruptor de hombre muerto sin depender de trabajos cron, temporizadores o bases de datos. Deadcheck se integra con PagerDuty, una popular plataforma de gestión de incidentes, para mantener los incidentes en modo de espera hasta que se omite un registro, momento en el cual activa una alerta. Este proyecto es notable por su enfoque innovador para gestionar alertas e incidentes sin las dependencias tradicionales de programación o bases de datos.

Reacciones

  • Deadcheck es un proyecto en Go diseñado como un interruptor de hombre muerto, eliminando la necesidad de trabajos cron o bases de datos, e integra con PagerDuty para gestionar alertas.
  • La iniciativa ha generado debates sobre los interruptores de hombre muerto, incluyendo aspectos legales y soluciones alternativas como el uso de abogados o sistemas de blockchain.
  • Los usuarios han sugerido servicios existentes como Cronitor u OpsGenie para funcionalidades similares, y el proyecto planea expandir las integraciones más allá de PagerDuty.

Comprender las limitaciones del razonamiento matemático en los modelos de lenguaje grandes

  • La investigación titulada "GSM-Symbolic" de Iman Mirzadeh et al. examina las capacidades de razonamiento matemático de los Modelos de Lenguaje de Gran Escala (LLMs) utilizando el benchmark GSM8K. Los autores presentan GSM-Symbolic, un nuevo benchmark con plantillas simbólicas, demostrando que los LLMs tienen dificultades con variaciones en los valores numéricos y cláusulas adicionales en las preguntas. El estudio sugiere que los LLMs pueden replicar el razonamiento a partir de datos de entrenamiento en lugar de realizar un razonamiento lógico genuino, destacando sus limitaciones en el razonamiento matemático.

Reacciones

  • Los modelos de lenguaje grande (LLMs) enfrentan desafíos en el razonamiento matemático, especialmente cuando los problemas incluyen información irrelevante, lo que afecta su rendimiento. Esta limitación subraya la dependencia de los LLMs en el reconocimiento de patrones sobre el razonamiento lógico, haciéndolos menos efectivos en escenarios del mundo real con detalles superfluos. A pesar de los avances, los LLMs aún tienen dificultades para distinguir la información importante del ruido, una habilidad crítica necesaria para aplicaciones prácticas.

ARIA: Un modelo experto de mezcla nativa multimodal abierto

  • Aria es un modelo de IA nativo multimodal abierto que integra diversa información del mundo real para una comprensión integral, superando a modelos como Pixtral-12B y Llama3.2-11B en rendimiento. Es un modelo de mezcla de expertos con 3.9 mil millones y 3.5 mil millones de parámetros activados por token visual y de texto, respectivamente, mejorando sus capacidades lingüísticas y multimodales. Los pesos y la base de código del modelo son de código abierto, lo que facilita su adopción y adaptación por parte de desarrolladores e investigadores.

Reacciones

  • ARIA es un nuevo modelo multimodal nativo de Mezcla de Expertos (MoE) que supera a Pixtral-12B y Llama3.2-11B en rendimiento y velocidad de inferencia al utilizar eficientemente parámetros activos. A pesar de tener un uso de memoria similar a un modelo de 25B, ARIA funciona como un modelo de 10B y opera tan rápido como un modelo de 4B, lo que lo hace adecuado para dispositivos con memoria adecuada, como un M2 Max. Los expertos del modelo se centran en la sintaxis, con margen de mejora en la selección de expertos, y actualmente está disponible para pruebas, aunque algunos usuarios han encontrado problemas con la plataforma.