Saltar al contenido principal

2023-04-20

StableLM: Un nuevo modelo lingüístico de código abierto

Noticias

  • StableLM es un nuevo modelo lingüístico de código abierto diseñado para tareas de procesamiento del lenguaje natural.
  • El modelo es único en el sentido de que permite a los usuarios entrenarlo y perfeccionarlo en sus propios conjuntos de datos específicos, aumentando así el rendimiento en el aprendizaje del lenguaje para tareas concretas.
  • Su arquitectura se basa en BERT y está diseñada para minimizar el olvido catastrófico.
  • El modelo está preentrenado en un gran corpus de texto, que incluye Wikipedia y Common Crawl.
  • El software es fácil de usar y se puede acceder a él en GitHub, con documentación disponible para ayudar a los usuarios a empezar.
  • StableLM ya se ha utilizado en diversas aplicaciones, como la clasificación de textos y el análisis de sentimientos.

Reacciones del sector

  • Stability.AI ha publicado un nuevo modelo lingüístico de código abierto llamado StableLM, con modelos de entre 3B y 65B parámetros y una amplitud de contexto de 4096.
  • La evaluación del modelo ha recibido críticas, pero es una buena opción para los desarrolladores que quieran mejorarlo, ya que es de código abierto.
  • El modelo alfa de StableLM se está probando y se espera que supere a Pythia 6.9B y se entrenará con hasta 1,5 billones de tokens.
  • Los modelos más grandes aprenden más rápido, pero son propensos a sobreajustarse y las empresas obligan a los consumidores a pagar por adelantado la potencia de cálculo.
  • Los marcos de ML optimizados son cada vez más accesibles en el hardware de consumo, pero los buenos modelos lingüísticos requieren actualmente GPU caras que hacen de las API en la nube la única opción.
  • Servir modelos lingüísticos a través de API permite una inferencia muy optimizada, pero el cómputo local hace posible una mayor privacidad en las aplicaciones de IA.
  • Los investigadores de Stanford han publicado StableLM con una licencia de código abierto, lo que ha suscitado opiniones diversas.
  • El desarrollo y el uso de la inteligencia artificial son temas candentes que suscitan opiniones diversas sobre la posibilidad de que la IA superinteligente se apodere del mundo.

Hacer que un servidor Linux doméstico duerma en reposo y se despierte bajo demanda - de forma sencilla

Noticias

  • El artículo detalla cómo configurar un servidor doméstico que ejecuta Ubuntu Linux para dormir en reposo y despertar bajo demanda para alojar copias de seguridad de Time Machine.
  • Wake-on-LAN habilitado para despertar al servidor a través de paquetes unicast.
  • Servicios de red, incluyendo ARP Stand-in y Avahi, configurados para mantener la conectividad de red mientras el servidor duerme.
  • Código compartido para determinar el estado inactivo/ocupado y automatizar la suspensión a RAM mediante una tarea cron.
  • Se necesita un dispositivo Linux siempre activo y un dispositivo de interfaz de red que soporte Wake-on-LAN con paquetes unicast.
  • ARP Stand-in permite a un dispositivo de red responder a peticiones ARP en nombre de un servidor durmiente, activando su activación.
  • El autor utilizó Ruby y libpcap con un filtro para paquetes de petición ARP dirigidos a la dirección IP del servidor durmiente para implementar ARP Stand-in.
  • Se solucionan los problemas de activación no deseada causados por paquetes AFP y consultas NetBIOS.
  • El artículo explica cómo desactivar IPv6 y utilizar la duplicación de puertos para capturar paquetes de un dispositivo intermediario entre el servidor y el resto de la red.
  • El autor utiliza avahi como servicio sustituto de ARP.
  • El autor utilizó avahi-publish para configurar Raspberry Pi.
  • El autor creó una definición de servicio systemd que ejecuta automáticamente avahi-publish en el arranque.
  • La instalación ha tenido éxito durante más de un mes.

Reacciones de la Industria

  • Raspberry Pi es una opción popular para servidores de bajo consumo, pero algunos usuarios recomiendan su uso para sincronizar archivos con un servidor de copia de seguridad "real" en lugar de una configuración bajo demanda.
  • Las sugerencias para el funcionamiento de servidores de bajo consumo incluyen el uso de wifi y la configuración de ethernet para un funcionamiento de bajo consumo.
  • Se sugieren mini PCs alternativos como las placas NAS de Beelink y Topton.
  • Se recomienda el uso de ChatGPT para agilizar la resolución de problemas.
  • Se discuten las funciones de ahorro de energía y las dificultades que rodean la definición de "inactividad".
  • Se debaten las configuraciones Wake on LAN y las copias de seguridad autoalojadas frente a los servicios en la nube, así como las preocupaciones en torno a la privacidad y la vigilancia.
  • Los lectores comparten consejos para optimizar el uso de la energía, como la reducción de la velocidad de giro de los discos duros y el uso de fuentes de alimentación de bajo consumo.
  • Se habla de la tecnología IPv6 y sus ventajas.
  • Estrategias para minimizar el consumo de energía de los servidores domésticos.
  • El ARP spoofing puede utilizarse para despertar a un servidor dormido.

Usuario: Junnn11

Noticias

  • El post proporciona reconstrucciones y diagramas de varios artrópodos antiguos, incluyendo Euarthropods, Dinocaridids, lobopodians, y más.
  • El usuario, Junnn11, es un entusiasta de los artrópodos centrado en el problema de la cabeza de los panartrópodos, la filogenia de los subfílidos artrópodos y el linaje troncal, los quelicerados basales, los dinocarídidos y los lobopodios.
  • El post incluye una lista de varias especies de fuxianhuiidos, megacheiranos, picnogónidos, sinzifosurinos, casmataspídidos, euriptéridos, arácnidos y más.
  • También hay dibujos interpretativos de varios artrópodos antiguos.
  • El post proporciona enlaces a la página japonesa de Wikipedia y a la cuenta de Twitter del usuario.
  • En el post no se menciona ninguna publicación nueva o reciente.

Reacciones de la industria

  • Este post de Discussion Service muestra a personas muy interesadas en temas especializados, como la tecnología, la biología y el modelado.
  • Los usuarios hablan de las ventajas e inconvenientes de dedicarse a estos temas, como el impacto en la motivación y la legitimación de los intereses por parte del doctorado.
  • Las ilustraciones del usuario Junnn11 sobre la biomecánica y el movimiento de los artrópodos en una página de Wikipedia han suscitado debates sobre biología, genética y el concepto de la visión.
  • Los usuarios también discuten el "Problema de la cabeza de artrópodo" y las preferencias de diseño del usuario, como las imágenes de carga lenta.
  • La carga perezosa de las etiquetas en las páginas web por defecto es un problema de privacidad que actualmente no está implementado en Safari o Firefox, y puede romper algunos sitios web.
  • La aplicación MediaWiki es una plataforma PHP para crear contenidos generados por los usuarios, y las ilustraciones de insectos de Junnn11 en una página de usuario han llamado la atención.
  • Y Combinator acepta solicitudes para el verano de 2023.

Offline es sólo online con latencia extrema

Noticias

  • Peter Van Hardenberg aboga por un software local-first en el que los programas se ejecuten en dispositivos y aprovechen la nube para "durabilidad o accesibilidad" sin depender de ella.
  • El software tradicional de nivel empresarial y los servicios en la nube son como construir caros portaaviones cuando se necesitan herramientas sencillas, personales y fáciles de mantener.
  • Online y offline deben considerarse como un continuo con diferentes niveles de latencia.
  • Offline no es más que la forma más extrema de latencia y tiene sus propias gradaciones de segundos, minutos, horas, días y más.
  • Cambiar la idea de binarios online/offline por un espectro de latencia abre nuevas puertas para construir cosas diferentes.

Reacciones de la industria

  • El artículo analiza el concepto de aplicaciones offline frente a online y el debate en torno a si deben considerarse lo mismo o categorías distintas con sus propios requisitos.
  • La conversación ahonda en la IU pesimista frente a la optimista y en la localidad de los datos frente a la propiedad de los mismos.
  • La resolución de conflictos es un tema complejo cuando se trata de aplicaciones offline y las soluciones deben diseñarse para gestionar tanto el entorno online como el offline.
  • Se propone un enfoque de los productos basado en la sincronización de datos.
  • Las experiencias "offline-first" deben diseñarse cuidadosamente para tratar todo como una fuente de verdad y gestionar las migraciones de esquemas y lógica empresarial.
  • Algunos usuarios prefieren las aplicaciones entre pares a los servicios basados en Internet por motivos de privacidad y control.
  • La elección del enfoque (local o basado en la nube) depende de las necesidades y preferencias del usuario.
  • El debate aborda los retos técnicos, como los sistemas NAT y de descubrimiento, y analiza posibles soluciones, como las normas federadas y las redes malladas.
  • Se menciona la importancia de la tolerancia offline en aplicaciones como Google Maps, iMessage y aplicaciones meteorológicas.
  • El debate se centra en si el offline-first es una solución viable para las herramientas de colaboración.
  • Varios comentaristas discuten los pros y los contras de la comunicación offline frente a la online y la importancia de un diseño resistente.

La mayoría de mis habilidades ahora no valen nada, pero el 10% valen 1000x

Noticias

  • La tecnología de IA como ChatGPT puede transformar el valor de las habilidades de desarrollo de software
  • Aunque algunas habilidades pueden perder valor, la IA puede ofrecer nuevas oportunidades para utilizar las habilidades restantes.
  • ChatGPT puede automatizar tareas, desarrollar soluciones a problemas complejos y ayudar a los desarrolladores a colaborar.
  • Mantener la experiencia de los desarrolladores humanos es esencial, y validar los resultados de la IA es crucial.
  • La integración de herramientas de IA puede mejorar la eficiencia sin sacrificar la calidad.
  • La IA no puede sustituir a la creatividad, la experiencia y el pensamiento crítico humanos.
  • Los desarrolladores de software deben adoptar la IA y reconocer su valor único.

Reacciones del sector

  • ChatGPT puede ofrecer respuestas precisas para tareas técnicas sencillas, pero puede equivocarse con seguridad en las más complicadas.
  • La calidad de las respuestas de ChatGPT podría mejorarse entrenándolo con corpus de mayor calidad, mientras que otros advierten del peligro de confiar demasiado en la IA para el aprendizaje.
  • Los grandes modelos lingüísticos pueden carecer de material fuente en ciertas áreas, pero la posibilidad de interactuar con ChatGPT y las correcciones pueden ser útiles.
  • ChatGPT puede proporcionar información básica para los no expertos, pero puede necesitar validación y verificación.
  • Los modelos generativos podrían democratizar la escritura y ayudar a generar más texto, pero los escépticos creen que podría conducir al analfabetismo y a la eliminación de algunos trabajos de escritura.
  • El texto generado por IA podría llevar a la eliminación de los trabajos de escritura peor pagados, pero puede no afectar a la escritura de alta calidad y mejor remunerada.
  • Los chatbots de IA pueden generar código deficiente, y los legisladores y jueces que adopten el texto generado son motivo de preocupación.
  • Los modelos lingüísticos basados en IA mejoran la productividad de los redactores, pero no pueden sustituir por completo a los buenos escritores.
  • Es posible que la escritura se convierta pronto en una parte importante del trabajo de todo el mundo, pero muchos escritores y editores tendrán que cambiar de profesión.
  • La tecnología y la IA han dejado obsoletas en repetidas ocasiones viejas formas de hacer las cosas, como los ordenadores humanos en bancos y hojas de cálculo, pero no pueden sustituir las competencias básicas de los diseñadores gráficos.

Por qué algunos investigadores creen que me equivoco sobre las redes sociales y las enfermedades mentales

Noticias

  • Los científicos sociales debaten si las redes sociales son la causa principal de la epidemia de enfermedades mentales entre los adolescentes.
  • Los críticos sostienen que las pruebas no son lo suficientemente sólidas como para apoyar las afirmaciones de que son perjudiciales.
  • Los defensores argumentan que algo importante está ocurriendo con la salud mental de los adolescentes que comenzó alrededor de 2012, sin explicación alternativa.
  • Las tasas de enfermedades mentales y el uso de las redes sociales no tienen una clara relación causa-efecto, pero los escépticos no pueden explicar la epidemia de forma tan clara como la teoría del SSM.
  • Los escépticos exigen un alto nivel de escepticismo basado en el principio de "más allá de toda duda razonable", que es inapropiado para los casos civiles.
  • Existe desacuerdo entre los científicos sobre la magnitud de la correlación entre el uso de las redes sociales y los problemas de salud mental.
  • Las redes sociales pueden ser especialmente perjudiciales para las niñas.
  • Los investigadores suelen centrarse en un modelo causal cuando convierten una cuestión en variables que pueden medir, lo que puede ocultar otras posibles vías causales.
  • Dos de los modelos causales que podrían explicar el aumento de las enfermedades mentales en adolescentes son el modelo del periodo sensible y el modelo de la pérdida de IRL.
  • El autor recomienda medidas como retrasar el uso de los smartphones hasta el instituto, tener colegios libres de teléfonos y elevar la edad de "adultez en Internet" a los 16 años.
  • El gobierno federal no ha hecho nada para reducir el uso de smartphones por menores de edad, y es necesario un debate nacional y mundial sobre si los smartphones y las redes sociales interfieren en el desarrollo saludable de los adolescentes.
  • Se necesitan escépticos que presenten contraargumentos contra los alarmistas y señalen los puntos débiles de las pruebas.
  • La verificación de la edad de los smartphones puede hacerse mediante métodos innovadores que ya ofrecen empresas como Clear.

Reacciones de la industria

  • La vigilancia constante de los compañeros y la naturaleza adictiva de las redes sociales están causando problemas de salud mental, falta de sueño y crecimiento personal.
  • El debate subraya la necesidad de una comprensión matizada de los efectos de los medios sociales en la salud mental, incluida la depresión, el acoso y el suicidio.
  • El cambio hacia videojuegos siempre conectados que fomentan comportamientos adictivos es preocupante, y algunos abogan por medidas para proteger a los menores de 18 años.
  • Las redes sociales han afectado a la vida de los niños limitando su desarrollo de la independencia, y la falta de actividad al aire libre es un problema que hay que abordar.
  • Se discute la fiabilidad de los autoinformes y de los datos a nivel poblacional en relación con la comprensión de las causas de la depresión.
  • Las pruebas disponibles apoyan la afirmación de que los medios sociales causan problemas de salud mental, y la dirección de la causalidad es difícil de establecer.
  • Se analiza el impacto del cambio climático en la salud mental de los jóvenes, la falta de activismo en torno a él y el papel de las empresas, los gobiernos y los individuos.
  • También se mencionan el consumo de energía y la falta de alternativas ideales a los combustibles fósiles, así como las malas prácticas parentales.

ChatPDF - Chatea con cualquier PDF

Noticias

  • ChatPDF ofrece una herramienta para mejorar las experiencias de aprendizaje de los estudiantes, ayudándoles a comprender libros de texto y trabajos de investigación.
  • La plataforma puede analizar eficazmente una serie de documentos, como informes financieros y de ventas, propuestas de proyectos, manuales de formación y contratos legales.
  • ChatPDF ofrece almacenamiento seguro en la nube para datos confidenciales y la posibilidad de borrarlos en cualquier momento.
  • Para las mentes curiosas, ChatPDF puede desvelar una gran cantidad de conocimientos a partir de documentos históricos, literatura y otras fuentes.
  • La herramienta entiende cualquier idioma y puede responder en la lengua preferida del usuario.
  • ChatPDF ofrece una API, opciones de precios, preguntas frecuentes, programa de afiliados y soporte a través de Twitter y correo electrónico.

Reacciones del sector

  • ChatPDF es un nuevo servicio que permite a los usuarios hacer preguntas sobre documentos PDF utilizando la API GPT de OpenAI para generar respuestas.
  • Entre las sugerencias para mejorar el servicio figuran ajustar el tamaño de los trozos, optimizar la búsqueda semántica o la recursividad para PDF más complejos y fragmentar el texto en PDF.
  • Algunos usuarios se muestran escépticos, mientras que otros destacan ventajas como la mejora de los resultados de búsqueda y la indexación semántica.
  • Se sugieren soluciones alternativas autoalojadas para el uso de ChatGPT en el caso de documentos sensibles
  • ChatPDF es similar a otros servicios de indexación semántica, con sugerencias de posibles mejoras como una versión de prueba
  • Algunos comentaristas bromean sobre la exageración que rodea a los modelos GPT AI sugieren otros tipos de archivos para el análisis

El port GTK+3 de GIMP está oficialmente terminado

News

  • No se ha encontrado ningún contenido significativo en el texto proporcionado.

Reacciones de la industria

  • El port GTK+3 de GIMP ya está completo.
  • La retrocompatibilidad es crucial para el espacio de usuario y el nivel de compatibilidad de Windows es elogiado para las aplicaciones individuales.
  • Existen pocas soluciones para ejecutar cosas antiguas de Linux con las bibliotecas pertinentes.
  • Debian 12 seguirá incluyendo GTK2, a pesar de que algunas distribuciones están intentando eliminarlo.
  • Construir un conjunto de herramientas de interfaz gráfica de usuario de alta calidad requiere madurez, exhaustividad y esfuerzo.
  • Algunos conjuntos de herramientas de interfaz de usuario carecen de widgets comunes y obligan a los desarrolladores a utilizar otros de terceros.
  • Un desarrollador propone utilizar un Árbol de Sintaxis Abstracta para permitir una compatibilidad binaria sin fisuras en APIs e interfaces.
  • GIMP quiere pasar a GTK4 para mejorar la compatibilidad con Wayland, la compatibilidad con HiDPI y un aspecto más limpio.
  • Está prevista la introducción de la edición no destructiva en GIMP 3.2.
  • Se anima a los usuarios a cambiar a GTK3 o GTK4, pero hay opiniones encontradas.
  • KDE y sus aplicaciones son una alternativa potencial a GTK.

Satélite toma imagen de otro satélite

News

  • No hay contenido significativo presente; no se puede proporcionar un resumen.

Reacciones de la industria

  • El satélite Landsat de la NASA tomó una imagen de otro satélite, suscitando un debate en torno a la tecnología y la ingeniería de satélites.
  • Los usuarios compartieron datos interesantes sobre varios satélites, incluidos los de radar láser y los de inteligencia.
  • Las empresas trabajan en proyectos para obtener mejores imágenes enviando satélites más cerca de la Tierra.
  • Maxar Technologies publicó un vídeo en el que mostraba su satélite WorldView-4 tomando imágenes de otro satélite en órbita, con vectores añadidos para su posicionamiento.
  • Algunos comentaristas señalaron los reflejos "chispeantes" causados por el aislamiento reflectante de las naves espaciales.
  • El vídeo se considera una prueba de la creciente viabilidad comercial de las imágenes en el espacio, a pesar de los comentarios negativos en las redes sociales.

Cómo hacer buenos juegos pequeños

Noticias

  • Hacer juegos pequeños con herramientas más sencillas puede aumentar las posibilidades de éxito de los nuevos desarrolladores.
  • Luchar con motores complejos puede disuadir a la gente de crear juegos.
  • El alcance emocional de un juego no determina su calidad.
  • Los juegos pequeños pueden tener diferentes definiciones de éxito, y es importante estar en sintonía con estas emociones más sutiles para obtener una experiencia completa.
  • Inspírate en diversas fuentes para crear juegos únicos.
  • Elegir un factor de forma afecta a las expectativas de los jugadores, así que tenlo en cuenta a la hora de elegir un motor y preparar el lanzamiento.
  • Termina tu juego antes de lanzarlo y evita publicar juegos "Continuará".
  • Es importante recibir comentarios de una comunidad que te apoye.
  • Céntrate en crear juegos que te gusten y te satisfagan, en lugar de intentar hacer una obra maestra o algo "genial".
  • El autor anima a los lectores a centrarse en crear comunidades positivas y solidarias y en encontrar la satisfacción creativa en su trabajo, en lugar de amargarse o desilusionarse.

Reacciones de la industria

  • El artículo analiza formas de hacer buenos juegos pequeños y evitar el perfeccionismo, como priorizar las ideas e incubar múltiples ideas de juego.
  • Se subraya la importancia de hacer pruebas de juego y diseñar versiones pequeñas e iterativas de los juegos, así como de equilibrar los juegos para que sean justos y limitar el alcance del proyecto.
  • Algunos comentaristas señalan que ciertos géneros de juego pueden ser difíciles de destilar en juegos más pequeños sin alterarlos fundamentalmente.
  • El artículo destaca las ventajas de crear juegos pequeños, como la oportunidad de explorar diferentes mecánicas de juego y los límites del medio, y la satisfacción de crear algo único.
  • La gente debería acercarse al desarrollo de juegos con gusto crítico y comprensión del medio.

Firefly - Un nuevo compilador y runtime para lenguajes BEAM

Noticias

  • Firefly es un compilador y runtime para lenguajes BEAM, escrito en Rust, que permite compilar aplicaciones Elixir apuntando a WebAssembly
  • Firefly puede compilar ejecutables o bibliotecas que actúan como lanzamientos OTP, pero no gestiona dependencias
  • Firefly consta de tres componentes principales: Compilador, Bibliotecas y Runtimes, y sacrifica algunas características para permitir optimizaciones adicionales
  • Se requiere LLVM 15 para compilar Firefly, y los colaboradores deben comunicarse primero con el equipo central antes de implementar cambios.
  • Firefly no pretende sustituir a BEAM y puede carecer de la funcionalidad necesaria, pero ofrece una implementación alternativa de Erlang/OTP con características únicas.
  • El diseño del tiempo de ejecución es el mismo que el de OTP, pero varía en función del backend codegen utilizado, y Firefly facilita la ampliación del tiempo de ejecución con funciones nativas implementadas en Rust.
  • Firefly se llamaba antes Lumen y tiene licencia Apache 2.0.

Reacciones del sector

  • Firefly, un nuevo compilador y tiempo de ejecución específico para lenguajes BEAM, se ha lanzado con un enfoque en la compilación WASI y la capacidad de crear binarios autónomos dirigidos a varios conjuntos de chips.
  • Un aspecto interesante de Firefly es su potencial para ejecutar Elixir de forma eficiente en microcontroladores sin perder su espíritu de concurrencia.
  • BEAM es la máquina virtual que soporta varios lenguajes de programación, y el cambio de nombre del proyecto Lumen a Firefly fue necesario debido a la existencia de varios proyectos con nombres similares.
  • Los desarrolladores están discutiendo la optimización del tiempo de ejecución BEAM para Elixir, y algunos argumentan que no está optimizado en torno a las matemáticas.
  • El tiempo de ejecución de BEAM se centra en la E/S, con un rendimiento diseñado en torno a la latencia, y ahora admite la compilación JIT utilizando un JIT escrito desde cero en lugar de LLVM.
  • Firefly permite a los desarrolladores compilar aplicaciones Elixir para WebAssembly, lo que resulta útil para ejecutar Elixir en el frontend a pesar de las dificultades de manipular el DOM en un entorno de prueba Elixir.

Align Your Latents: Síntesis de vídeo de alta resolución con modelos de difusión latente

Noticias

  • Un equipo ha desarrollado modelos de difusión latente de vídeo (Video LDMs) para la generación de vídeo de alta resolución, logrando un rendimiento puntero a una resolución de 512 x 1024.
  • El modelo utiliza la atención temporal y las convoluciones tridimensionales para lograr un rendimiento del descodificador ajustado a la generación de vídeo de alta calidad.
  • El nuevo método también es capaz de generar texto a partir de vídeo, lo que abre interesantes vías para la creación de contenidos en el futuro.
  • El equipo ha demostrado que las capas temporales de su método se generalizan a diferentes LDM de texto a imagen ajustados con precisión.
  • La investigación fue presentada por Andreas Blattmann, Robin Rombach, Huan Ling, Tim Dockhorn, Seung Wook Kim, Sanja Fidler y Karsten Kreis en la 2023 IEEE Conference on Computer Vision and Pattern Recognition.
  • Esta investigación tiene potencial para ser útil en la industria del cine y el entretenimiento.

Reacciones de la industria

  • Nvidia ha desarrollado un método de síntesis de vídeo de alta resolución que utiliza modelos de difusión latente entrenados en conjuntos de datos de vídeo.
  • La futura generación de vídeo podría utilizar herramientas de modelado 3D multimodal que se perfeccionen con filtros basados en la difusión.
  • Los renderizadores diferenciables que utilizan representaciones volumétricas y campos de distancia son una posible solución para la discretización de escenas de vídeo.
  • El concepto de "valle misterioso" se discute en la sección de comentarios.
  • Nvidia entrenó un modelo de texto a vídeo capaz de generar escenas de conducción realistas con una suavidad sin precedentes en su movimiento.
  • Surgen dudas sobre el posible uso indebido de la tecnología y se cuestiona si el modelo se hará público.
  • La financiación es un reto debido a la "tragedia de los comunes".
  • Los investigadores se centraron en la simulación de vídeo para entrenar modelos complejos de IA utilizados en vehículos autónomos.

NaturalSpeech 2: sintetizadores de voz y canto de disparo cero

Noticias

  • NaturalSpeech 2, un nuevo sistema TTS de Microsoft Research Asia y Microsoft Azure Speech, utiliza un modelo de difusión latente para sintetizar voces naturales con una gran expresividad y una gran capacidad de disparo cero.
  • El sistema supera a los sistemas TTS anteriores y ofrece una calidad de voz, una solidez y una similitud prosodia/timbre superiores a las de otros sistemas TTS.
  • El sistema utiliza un códec de audio neural, cuantificadores vectoriales residuales y un modelo de difusión condicionado a la entrada de texto, lo que mejora la capacidad de zero-shot.
  • Al desarrollar esta tecnología, Microsoft demuestra su compromiso con los principios de la IA responsable.
  • Existe la posibilidad de un uso malintencionado en la imitación de locutores y la suplantación de voz, por lo que se insta a los profesionales a no abusar de la tecnología.
  • Este artículo subraya la necesidad de un desarrollo y un uso responsables de la tecnología de IA y la importancia de defender las herramientas de detección de voces sintetizadas por IA.

Reacciones de la industria

  • Los investigadores han desarrollado sintetizadores de voz y canto Zero-shot, lo que suscita preocupación por el posible abuso de técnicas de suplantación de voz deepfake.
  • La discusión dio lugar a un debate sobre la alineación de la IA, la complejidad de los valores humanos y las cuestiones éticas en torno a la aportación de datos personales a conjuntos de datos masivos.
  • Un experimento muestra que GPT-3 puede crear voces falsas, lo que hace temer que se difunda desinformación.
  • Los expertos debaten sobre los modelos de aprendizaje de idiomas y el potencial de los traductores universales, con preocupaciones por la autenticación de la identidad digital y la ciberdelincuencia.
  • Debate sobre la autenticación humana frente a la IA por teléfono, con discusiones también en torno a los aspectos técnicos de la autenticación de voz y la tecnología de síntesis.
  • El NaturalSpeech 2 de Microsoft es un ejemplo de aprendizaje sin intervención que puede dar lugar a abusos, lo que ha llevado a la empresa a hacer una declaración ética.
  • FADR aísla MIDI, batería, bajo y voz de un archivo de audio con margen de mejora.
  • Los investigadores exploran modelos de IA para voces de cantantes de ópera y coro.
  • YourTTS es un sistema de conversión de texto en voz rápido y eficaz.
  • Las solicitudes para el curso de verano 2023 están abiertas.

Qantas trae de vuelta los Airbus A380 del desierto de California.

Noticias

  • Qantas ha recuperado su último Airbus A380 del cementerio de Victorville, en California, tras casi 1.000 días de almacenamiento debido a la inmovilización de los aviones de largo recorrido a causa de la pandemia.
  • Volver a poner en servicio un A380 requiere un esfuerzo considerable, incluidas 4.500 horas de mano de obra y la sustitución de piezas cruciales, lo que provocó retrasos en algunas compañías aéreas.
  • Los ingenieros de Qantas pasaron dos meses por avión en el desierto de Mojave para revivir los A380, que se envolvieron para protegerse de la humedad, el polvo y los insectos.
  • Aunque Qantas está a punto de devolver sus A380 a la acción, la aerolínea no espera que los vuelos internacionales vuelvan a los niveles anteriores a la pandemia hasta al menos 2024.
  • Qantas ha invertido mucho en poner en marcha la industria australiana de combustibles de aviación sostenibles, mientras lucha por cumplir su objetivo de reducción de emisiones de carbono neutrales para 2050.
  • Qantas aún no ha anunciado un plan para sustituir su vetusta flota de A380, pero prevé gastar 5.000 millones de dólares (7.400 millones de dólares) en inversiones en su flota en los próximos cuatro años, incluida una docena de A350-1000.

Reacciones del sector

  • Qantas está recuperando Airbus A380 almacenados en el sur de California para vuelos de Sydney y Melbourne a Dubai, debido a la gran demanda de vuelos de Australia a Europa.
  • Emirates, el mayor propietario de A380, pide un avión más grande para satisfacer la alta demanda de vuelos, pero ninguno de los fabricantes de motores está interesado en desarrollar nuevos motores para el A380, lo que pone en duda el futuro del avión.
  • Los elevados costes del A380 y la menor demanda del mercado han reducido su competitividad frente a otros aviones de fuselaje ancho, y los problemas de motor han limitado su capacidad.
  • El problema del Boeing 737 Max MCAS no es la primera vez que el avión tiene problemas, y Boeing no tendrá un sustituto del 737/757 hasta dentro de 10-15 años, lo que da a Airbus una ventaja competitiva.
  • La colusión pasiva en los mercados puede dar lugar a precios más altos y a una menor competencia, y la colusión tácita en la industria aeronáutica podría dar lugar a mayores beneficios.
  • El A380 puede seguir utilizándose como avión de carga para cargas de gran tamaño, pero carece de las características necesarias para su uso como avión de carga general.
  • Con el A380, Airbus pasó de centrarse en las rutas de éxito a la corona de "somos los más grandes", pero ahora tiene competidores para esas rutas con aviones como el A350, el A321-XLR y los neoaviones.
  • Las aerolíneas hub ofrecen más frecuencia de vuelos, pero los pasajeros prefieren aerolíneas con múltiples vuelos a distintas horas del día.
  • Los expertos debaten soluciones para que el combustible de aviación alcance la neutralidad de carbono, como los biocombustibles, los árboles y la inversión en combustibles de aviación sostenibles.

La construcción de telescopios en la Luna podría transformar la astronomía

Noticias

  • La construcción de telescopios en la Luna podría transformar la astronomía
  • La exploración lunar está experimentando un renacimiento con numerosas misiones previstas, entre ellas el programa Artemis de la NASA, cuyo objetivo es devolver seres humanos a la superficie lunar a mediados de la década
  • La superficie estable de la Luna y sus cráteres, que no reciben luz solar, ofrecen ventajas para la astronomía observacional.
  • La cara oculta de la Luna es particularmente atractiva para la radioastronomía, ya que está permanentemente protegida de las señales de radio generadas por los seres humanos en la Tierra, lo que la convierte probablemente en el lugar más "radio-silencioso" de todo el sistema solar.
  • La cara oculta de la Luna es también un lugar ideal para la radioastronomía de baja frecuencia, que puede estudiar la estructura del universo primitivo.
  • La baja gravedad de la Luna también permite la construcción de telescopios mucho más grandes que los satélites de vuelo libre.
  • El entorno frío y estable de los cráteres en sombra permanente también puede ofrecer ventajas para los instrumentos de detección de ondas gravitacionales y para el estudio del viento solar y los rayos cósmicos galácticos.
  • Sin embargo, existe una tensión entre las actividades humanas en la cara oculta lunar y las interferencias radioeléctricas no deseadas, y los planes para extraer agua-hielo de los cráteres sombreados podrían dificultar el uso de esos mismos cráteres para la astronomía.

Reacciones de la industria

  • La construcción de telescopios en la Luna podría revolucionar la astronomía al proporcionar una mayor sensibilidad y resolución espectrográfica.
  • El elevado coste de la construcción de telescopios se justifica con la esperanza de realizar descubrimientos científicos pioneros, inspirar a las generaciones futuras e impulsar la innovación técnica.
  • El valor de los descubrimientos científicos no puede cuantificarse en dólares por unidad y comparte un enfoque de alto coste y alta recompensa con campos como la física de partículas.
  • El gasto militar ha impulsado históricamente los avances científicos.
  • Los beneficios tangibles de la financiación de la investigación científica incluyen proporcionar un marco para el funcionamiento de la tecnología, beneficiar a la sociedad a través de descubrimientos de investigaciones inesperadas y cultivar una mano de obra altamente cualificada.
  • El telescopio propuesto FOCAL podría proporcionar mediciones científicas que de otro modo serían imposibles y es más importante que asentarse en Marte.
  • El programa Artemis de la NASA pretende construir un radiotelescopio en la cara oculta de la Luna, que tiene un entorno radiosilencioso y podría producir imágenes de mayor calidad que cualquier observatorio en la Tierra sobre la radiación cósmica del Big Bang.
  • La ubicación del telescopio en la Luna supera una de las mayores dificultades de los telescopios espaciales, ya que la roca lunar protege contra la mayoría de las fuentes de ruido de alta frecuencia procedentes de satélites, artificiales o naturales.
  • Las complicaciones técnicas relacionadas con el entorno lunar, como el polvo fino que cubre los equipos, el control térmico y los problemas de comunicación con la Tierra, deben ser resueltas por los ingenieros espaciales.
  • La comunicación con Marte podría mejorar utilizando tecnología moderna de almacenamiento, satélites de Venus o una órbita halo en L2, L4 o L5 Tierra-Luna, pero la Luna es difícil de orbitar debido a la irregularidad de la gravedad.
  • La existencia real y la detección de materia y energía "oscuras" siguen siendo difíciles de determinar, y el uso de planetas o asteroides para obtener un efecto de lente gravitatoria es poco práctico debido al gran punto focal.
  • El descubrimiento de los mascones llevó al estudio de su efecto sobre las naves espaciales, y al descubrimiento de las "órbitas congeladas".
  • Un telescopio en la Luna presenta más acceso y menos riesgos de mantenimiento que telescopios como el JWST, que están demasiado lejos para que el Hubble pueda observarlo.
  • En la sección de comentarios se debate la probabilidad y el coste de un proyecto de telescopio lunar y la tendencia a buscar agua en los cuerpos celestes.