Saltar al contenido principal

2023-04-18

MiniGPT-4

Noticias.

MiniGPT-4, un modelo lingüístico que alinea un codificador visual congelado con un gran modelo lingüístico congelado, Vicuna, utilizando sólo una capa de proyección, posee capacidades similares a las exhibidas por GPT-4, como generar descripciones detalladas de imágenes y escribir historias y poemas inspirados en imágenes dadas. El modelo es muy eficiente desde el punto de vista computacional, ya que sólo utiliza unos 5 millones de pares imagen-texto alineados y sólo requiere entrenar la capa lineal para alinear las características visuales con el gran modelo de lenguaje Vicuna. Los creadores están preparando para el futuro un modelo más ligero que pueda ejecutarse en una sola GPU 3090.

Reacciones de la industria.

Los investigadores crean un modelo MiniGPT-4 que supera a los demás uniendo el formador ViT-L+Q de BLIP2 a Vicuna-13B con una capa lineal y entrenando sólo la capa pequeña en algunos conjuntos de datos de imagen-texto. Otros comentarios se refieren a los modelos de aprendizaje automático, la ejecución de LLM en CPU y la comercialización de productos basados en modelos más pequeños. Investigadores de la Universidad Rey Abdullah desarrollan Vicuna, una arquitectura de transformadores GPT que genera programas informáticos y sitios web a partir de lenguaje natural con una eficiencia de aprendizaje mejorada. El rendimiento más rápido y eficiente de GPTQ 4bit presenta interesantes posibilidades para el resumen de vídeos y otras aplicaciones para software y tecnología.

RedPajama: Reproducción de LLaMA con licencia amistosa

Noticias.

RedPajama, un proyecto para crear modelos líderes de código abierto, comienza reproduciendo el conjunto de datos de entrenamiento LLaMA de más de 1,2 billones de tokens; RedPajama tiene tres componentes clave: datos de preentrenamiento, modelos base y datos y modelos de ajuste de instrucciones; RedPajama ha publicado el conjunto de datos completo RedPajama de 1,2 billones de tokens y puede descargarse una muestra aleatoria más pequeña y consumible a través de Hugging Face.

Reacciones de la industria.

Together XYZ ha publicado RedPajama, un conjunto de datos de modelos lingüísticos de código abierto que es cuatro veces mayor que el GPT-3 de OpenAI y responde a las críticas de los investigadores de IA sobre el carácter cerrado del desarrollo y la implantación de modelos lingüísticos. Los comentarios en Hacker News hacen referencia a varios derivados como Pythia, OpenAssistant, StableDiffusion y Midjourney, destacando sus puntos fuertes y débiles, con especial atención a la calidad y el control de las imágenes. Existe un debate en curso sobre la posibilidad de proteger los derechos de autor de los pesos de la IA, y RedPajama se enfrenta a retos a la hora de crear una iniciativa sostenible de IA de código abierto que pueda competir con las grandes tecnológicas.

Samsung estudia cambiar a Bing como motor de búsqueda predeterminado

Noticias.

Al parecer, Samsung está en conversaciones con Microsoft para que Bing sea el motor de búsqueda predeterminado en sus dispositivos Galaxy, incluidos los teléfonos inteligentes y tabletas basados en Android, y Google parece estar en "modo pánico". Google está trabajando en su contrapropuesta, el proyecto "Magi", que al parecer ofrecerá una experiencia mucho más personalizada que su servicio actual. Google invitó recientemente a sus empleados a probar la IA en el motor de búsqueda, con un posible lanzamiento en mayo de 2023.

Reacciones de la industria.

Samsung está considerando cambiar a Bing como su motor de búsqueda predeterminado, potencialmente debido a la creciente presión publicitaria de Google en Google Cloud Platform (GCP) y para exprimir más pagos de Samsung y Apple. Bing podría superar a Google en un posible acuerdo sobre motores de búsqueda, y Microsoft está presionando a Samsung para que cree un nuevo dispositivo. Existe un debate sobre el declive de la calidad y las tácticas SEO de Google, que empuja a los usuarios hacia motores de búsqueda alternativos como ChatGPT, DDG, Brave Search y Bing. Además, la experiencia del escritorio Linux ha mejorado, y muchos usuarios optan por Linux para trabajar, mientras que los Chromebooks son preferidos en el sector educativo.

Me ha gustado este sencillo ejercicio de cálculo

Noticias.

El autor comparte un ejercicio de cálculo que requiere que los estudiantes comprendan lo que la integral está calculando, en lugar de limitarse a confiar en reglas fijas para integrar funciones comunes. Para resolver el problema, los estudiantes pueden utilizar gráficas, descomponer funciones complicadas en partes más sencillas, tratar con funciones a trozos continuas y utilizar la simetría. El ejercicio puede ayudar a los estudiantes a aprender técnicas valiosas y la observación de que no todos los problemas se pueden resolver simplemente empujando alrededor de los símbolos.

Reacciones del sector.

Los usuarios de Hacker News debaten sobre la enseñanza del cálculo y sugieren más ejercicios para comprobar la comprensión. También sugieren utilizar software moderno y reforzar los conceptos básicos a lo largo del curso. Además, comparten recursos para verificar modelos matemáticos o ejercicios.

Arranque de CPUs Intel modernas

Noticias.

  • El arranque de las CPU Intel modernas implica la verificación de firmas y la ejecución de módulos de código autenticado (ACM) para detectar ataques o malware.
  • BootGuard, la solución de seguridad de Intel para el arranque, verifica las actualizaciones del microcódigo, comprueba si hay cabeceras en la memoria flash del sistema, lee un ACM, verifica su firma y ejecuta el IBB en modo de 32 bits.
  • El post habla de confiar en el firmware para el trabajo pesado en lugar del SO y está bien escrito para los nuevos lectores de la industria tecnológica, sin sesgos políticos/religiosos ni externalización del texto, pero sin ningún aspecto emocionante o novedoso.

Reacciones de la industria.

Se discuten las CPU de Intel y las dificultades con el arranque de procesadores auxiliares en sistemas múltiples, junto con formas de resolver estos problemas mediante llamadas a funciones y código ensamblador sin usar memoria ni pilas. Algunos desarrolladores expresan su frustración por los fallos del firmware y la falta de fiabilidad de los productos, mientras que otros siguen satisfechos con alternativas más baratas que funcionan para sus necesidades. En la conversación también se habla del abandono del soporte de arranque heredado en favor de las actualizaciones de firmware, y de cómo el modo real ya no desempeña ningún papel en el arranque de los sistemas operativos modernos.

iOS 17 sentará las bases para la carga lateral de aplicaciones en el iPhone

Noticias.

Según un informe de Bloomberg, es posible que Apple añada la posibilidad de cargar aplicaciones en el iPhone con el lanzamiento de iOS 17. La compañía estaría sentando las bases para la carga lateral de aplicaciones en el iPhone. Al parecer, la compañía está sentando las bases de esta funcionalidad y podría hacer un anuncio al respecto en la próxima Conferencia Mundial de Desarrolladores (WWDC), que se celebrará en junio. No está claro si Apple permitirá la carga lateral con iOS 17 o si sólo está haciendo algunos cambios en el sistema operativo para permitirla más adelante.

Reacciones del sector.

Según se informa, iOS 17 de Apple permite la carga lateral de aplicaciones en los iPhones; algunos elogian la medida, mientras que otros se preocupan por la disminución de las medidas de seguridad. El debate se centra en el equilibrio entre la protección de la privacidad y la seguridad y la posibilidad de cargar aplicaciones. Los críticos sugieren que Apple tiene un monopolio y necesita ofrecer más opciones a los usuarios, mientras que los defensores señalan que las protecciones de privacidad y seguridad de Apple son superiores a las de su rival, Android.

El CEO de OpenAI afirma que la era de los modelos gigantes de IA ya ha terminado

Noticias.

El consejero delegado de OpenAI, Sam Altman, ha declarado que la era de la creación de grandes modelos lingüísticos como GPT está llegando a su fin. Aunque OpenAI sigue avanzando en el campo de la IA, los futuros progresos requerirán nuevas ideas y, según Altman, no se lograrán simplemente aumentando el tamaño de los modelos. Muchas nuevas empresas bien financiadas están intentando ponerse al nivel de la tecnología de OpenAI, y GPT-4 supone un giro inesperado en la carrera por desarrollar e implantar nuevos algoritmos de IA.

Reacciones de la industria.

El director general de OpenAI afirma que los grandes modelos de IA ya no son económicamente viables y que los futuros avances en IA vendrán de mejorar los modelos de otras formas. Los modelos multimodales son la nueva frontera de la investigación en IA. Algunos expertos se muestran escépticos ante las afirmaciones de OpenAI sobre el tamaño y las capacidades de GPT-4, mientras que otros señalan su potencial de crecimiento exponencial. Es posible que OpenAI necesite encontrar nuevas fuentes de datos de entrenamiento y mejorar la calidad de los algoritmos y los datos para obtener mejores modelos de IA. Los debates sobre la competencia lingüística y las limitaciones de GPT-4 han dado lugar a conversaciones sobre la mejora de los modelos lingüísticos mediante capacidades multimodales, objetivos de entrenamiento y optimizadores más eficientes y avances en el aumento de datos.

Microsoft eliminó los foros públicos de soporte para SwiftKey

News.

Este texto no está relacionado con el título "Microsoft eliminó los foros públicos de soporte para SwiftKey" y, por lo tanto, no se puede resumir en consecuencia. Por favor, facilítame el texto correcto para poder resumirlo.

Reacciones de la industria.

Microsoft ha eliminado los foros públicos de soporte para SwiftKey, al que los usuarios se sienten fieles porque aprende su estilo de escritura y se convierte en una extensión de su cuerpo; ahora sólo pueden enviar problemas por correo electrónico al equipo de atención al cliente de SwiftKey. Los comentarios abarcan diversos temas, como la verificación de la identidad en línea y los efectos de pasar demasiado tiempo en línea; otros incluyen cuestiones de discapacidad y adicción a las redes sociales. Sin embargo, algunos comentarios también hablan de los puntos fuertes de SwiftKey, como el aprendizaje de modelos de lenguaje mixto y el diseño ergonómico, que lo convierten en una alternativa básica a las opciones de teclado estándar de los dispositivos Android e iOS.

Sin código fuente == Sin patente

Noticias.

  • La divulgación del código fuente en las patentes de software es importante porque demuestra que un inventor puede poner en práctica la invención y añade credibilidad a una patente, especialmente en casos de infracción.
  • Incluir el código fuente satisface plenamente el requisito de descripción escrita y habilitación, reduciendo el número de solicitudes de patentes de software y evitando la ambigüedad en las especificaciones de diseño.
  • El artículo analiza casos legales y el estado actual de las patentes en tecnología informática y comunicaciones digitales, destacando la necesidad del código fuente en las patentes de software para resolver el problema de la experimentación razonable.

Reacciones de la industria.

El debate sobre si las patentes de software deben abolirse o mantenerse suscita discusiones en Hacker News, con argumentos a favor y en contra de la necesidad de las patentes para evitar el robo de ideas creadas de forma independiente. Algunos sugieren que las patentes de software obstaculizan la innovación y requieren algo más que una idea o concepto, como un objeto físico o una copia de trabajo, mientras que otros debaten la relevancia del código fuente y los algoritmos para los derechos de patente.

Hice que mi blog funcionara con energía solar, luego las cosas se complicaron

Noticias.

Un bloguero construyó un sistema alimentado por energía solar para hacer funcionar su blog y el escritorio de su ordenador utilizando paneles solares con una potencia combinada de 740 vatios, alimentados a través de un sistema de 12 voltios con una gran batería de plomo-ácido usada, un cargador solar Victron, un inversor y un interruptor Filax 2, y la recopilación de datos implica el uso de Python, InfluxDB y Grafana para recopilar y mostrar datos. El cableado de la batería sobredimensionado y el uso de un sistema de 24 o 48 voltios se recomiendan por seguridad y para reducir costes, y se utiliza una batería de plomo-ácido sellada por su seguridad. Un algoritmo de carga dinámica evita la descarga profunda de la batería, y un fondo con temática oscura puede ahorrar energía.

Reacciones de la industria.

En un hilo de Hacker News se discuten los pros y los contras de utilizar distintos tipos de baterías, como las de plomo, LiFePo4 y las de estado sólido, para proyectos de energía solar, y se sugiere que cada uno tenga en cuenta sus necesidades y objetivos específicos antes de decidirse por un tipo de batería. Los expertos comparten sus puntos de vista sobre las pruebas de capacidad y la sustitución de las baterías de plomo-ácido por baterías de litio-hierro-fosfato (LiFePO4), y aunque las baterías LiFePO4 pueden ser más ligeras y más rápidas de cargar, su coste total de vida sigue siendo comparable al de las baterías de plomo-ácido. Otros comentarios ofrecen consejos para construir sistemas de energía solar, como utilizar fuentes de alimentación USB-C, dividir la energía en fases y utilizar componentes de 24 V o CC, además de sugerir soluciones alternativas como turbinas eólicas o paneles como cubiertas.

Sold a Story: Cómo enseñar a leer a los niños salió tan mal

Noticias.

El proyecto de periodismo de investigación de American Public Media "Sold a Story" (Vendido un cuento) echa por tierra los actuales métodos de enseñanza de los programas de lectura de las escuelas, que se basan en una idea sobre cómo aprenden a leer los niños, originalmente expuesta por Marie Clay y demostrada hace mucho tiempo. Sin embargo, los productos que utilizan estas prácticas desacreditadas se están vendiendo a las escuelas de todo el país, con Heinemann ganando millones de dólares, y los padres, educadores y legisladores exigiendo cambios en el sistema. Los artículos incluyen entrevistas con influyentes educadores y políticos, análisis de investigaciones y materiales de orientación para que los educadores y los miembros de la comunidad debatan los temas en cuestión.

Reacciones del sector.

Se debaten diversos enfoques de la enseñanza de la lectura a los niños, como la fonética y la participación de los padres, haciendo hincapié en la instrucción y la evaluación individualizadas. Educadores y académicos debaten sobre la eficacia de la enseñanza basada en la fonética frente a la enseñanza de la palabra completa, y el artículo advierte contra la confianza ciega en las opiniones de los profesores. La discusión también incluye recomendaciones sobre recursos útiles para los padres, haciendo hincapié en la importancia de la enseñanza de la fonética para el dominio de la lectura, y en que la calidad de la educación en las escuelas primarias es actualmente objeto de debate.

La fiesta de la basura de Windows 11

Noticias.

El autor del artículo se queja del contenido por defecto que aparece en el menú Inicio de Windows 11, incluyendo una noticia sobre un tiroteo masivo que podría ser inapropiada para niños, y basura de la página principal de MSN en la alerta de información meteorológica. Aunque se puede desactivar este contenido, el artículo sugiere que la experiencia de Windows es decepcionante en general.

Reacciones del sector.

Los usuarios expresan su preocupación por la crisis de identidad de Microsoft y sugieren la necesidad de clarificar su visión y centrarse en ser un SO para corporaciones empresariales. Se expresa insatisfacción con Windows 11 y algunos sugieren utilizar Linux como alternativa. Se critican los anuncios intrusivos de Windows, los problemas de privacidad y el rendimiento. El post es irrelevante para los lectores expertos en tecnología interesados en las críticas de Windows 11.

Monthly Fediverse posts cross 1 billion for the first time

News.

Los mensajes mensuales de Fediverse han superado los mil millones por primera vez, según un reciente análisis de datos. Mastodon, una red social descentralizada impulsada por Masto.ai, cuenta con 8.900 usuarios activos y ofrece funciones como seguir hashtags y perfiles, dar favoritos, compartir y responder a publicaciones.

Reacciones del sector.

La red social descentralizada Fediverse ha alcanzado un hito de más de mil millones de publicaciones mensuales en varias plataformas, siendo Mastodon una alternativa notable a Twitter. Mientras algunos critican a Mastodon por su menor base de usuarios y su falta de escalabilidad, otros elogian sus interacciones de calidad y su sensación de comunidad. Mastodon sigue luchando por ganar terreno a Twitter debido a su centralización, y se desconoce su número exacto de usuarios activos diarios (DAU). Además, la Fediverse expresa su preocupación por las capacidades de búsqueda, el diseño de la UX y los problemas de censura.

El personal de AWS dedica 'gran parte de su tiempo a 'optimizar las nubes de los clientes'

Noticias.

El personal de AWS está ayudando a los clientes a optimizar su gasto en AWS para que puedan capear la incertidumbre económica, según la carta anual del CEO de Amazon.com, Andy Jassy, a los accionistas. Aunque el ritmo de crecimiento de AWS se está ralentizando como consecuencia de la optimización del gasto por parte de los clientes, AWS sigue registrando una sólida cartera de nuevos clientes y migraciones activas. Jassy también mencionó la intención de AWS de desarrollar más silicio personalizado y el potencial de su servicio de banda ancha por satélite Kuiper.

Reacciones del sector.

El personal de AWS dedica mucho tiempo a optimizar las nubes de los clientes, con opiniones dispares sobre el servicio de soporte, que van desde un gran soporte básico a problemas con los distintos niveles de soporte para los clientes. Las empresas pueden tener dificultades para contratar ingenieros de infra con los conocimientos necesarios, y la transición a la nube puede conllevar la pérdida de conocimientos sobre el trabajo con centros de datos. La infraestructura local tiene un coste prohibitivo y gestionar varios centros de datos puede ser doloroso, mientras que las complicadas arquitecturas en nube pueden crear cargas operativas innecesarias. La rentabilidad de la computación en nube frente a la computación in situ es objeto de debate, y las cargas puntuales o impredecibles favorecen la computación en nube. AWS compite con proveedores de nube más pequeños y baratos, y los desarrolladores se enfrentan a la complejidad de la implantación, el soporte operativo y la optimización de costes. La computación en nube se ha encarecido, y las empresas se alejan de ella en función de su uso, pero son pocas las que se pasan a una configuración on-prem por falta de los conocimientos necesarios.

Prueba de vuelo de una nave estelar [vídeo]

Noticias.

  • El último prototipo de nave estelar de SpaceX, SN10, ha completado con éxito un vuelo de prueba y aterrizaje a gran altitud, convirtiéndose en el primero en aterrizar sin explotar.
  • La SN10 fue capaz de ascender hasta 10 kilómetros y realizar un descenso panza abajo hasta su lugar de aterrizaje, pero un incendio posterior al aterrizaje causó daños en el cohete.
  • El consejero delegado de SpaceX, Elon Musk, ha anunciado que la empresa dará prioridad al desarrollo del propulsor Super Heavy para emparejarlo con el Starship en vuelos orbitales.

Reacciones de la industria.

SpaceX planea relanzar la Starship en 48 horas tras una prueba de vuelo abortada por un problema en una válvula presurizadora; los usuarios de Hacker News debaten sobre el mercado y la rentabilidad de la Starship, pero el artículo analiza el posible cambio de paradigma en la economía de los viajes espaciales si el cohete resulta ser tan reutilizable como predice Musk. Los comentarios también giran en torno al tema central del impacto del lanzamiento en las zonas horarias de EE.UU., y se teme que los manifestantes obstaculicen las pruebas de SpaceX.