Saltar al contenido principal

2024-02-07

Guía completa de SQL para científicos de datos: 100 consultas y ejemplos

  • La información proporcionada es un recurso completo para enseñar SQL a los instructores, que abarca temas como la gestión de bases de datos, las consultas SQL, la unión de datos, las funciones de ventana, las transacciones, los disparadores, la manipulación de datos JSON y la interacción de Python con las bases de datos.
  • El material incluye instrucciones de configuración, conceptos básicos y ejemplos de consultas SQL con sus resultados para diferentes escenarios.
  • También cubre conceptos como funciones de agregación, restricciones, upsert, normalización, y proporciona fragmentos de código que demuestran el uso de SQLite y Python, incluyendo el manejo de excepciones, el trabajo con fechas y horas, el uso de SQL en cuadernos Jupyter, y la utilización de Pandas con SQLite. También se incluye una lista de términos clave relacionados con las bases de datos y SQL.

Reacciones

  • El resumen abarca debates sobre ciencia de datos, SQL y temas relacionados, y explora la definición y las expectativas del papel del científico de datos.
  • Destaca la confusión en torno a los diferentes títulos y expectativas dentro del campo.
  • Se discute la utilidad de herramientas como ChatGPT para escribir consultas SQL en inglés sencillo, junto con los retos que plantea el uso de Clickhouse para las uniones SQL y el trabajo con datos de series temporales.
  • Se ofrecen recomendaciones sobre tutoriales de SQL, recursos para la optimización de consultas y una sugerencia para utilizar DuckDB.

Una filtración del banco HSBC destapa hipotecas fraudulentas alimentadas por falsos ingresos chinos en el sector inmobiliario de Toronto

  • Un denunciante del banco HSBC de Canadá ha descubierto pruebas de hipotecas fraudulentas en Toronto, con ingresos chinos falsos y estimadas en más de 500 millones de dólares.
  • Estos préstamos hipotecarios fraudulentos fueron emitidos por al menos 10 sucursales de HSBC en el área de Toronto desde 2015, con un aumento durante la pandemia de Covid-19.
  • Los compradores chinos de la diáspora obtenían hipotecas del HSBC mientras declaraban sueldos extravagantes de trabajos a distancia en China, utilizando documentos falsos para blanquear dinero.

Reacciones

  • El banco HSBC de Canadá está presuntamente implicado en la emisión fraudulenta de hipotecas a compradores chinos de la diáspora en Toronto, en la que posiblemente estén implicados empleados y un alto directivo.
  • El problema puede ir más allá de una sucursal y extenderse a todo el banco, suscitando preocupación por el blanqueo de dinero, el fraude, la inflación de los precios de la vivienda y los riesgos potenciales para el sistema bancario canadiense.
  • El debate se centra también en el impacto de los ingresos no gravados en el mercado inmobiliario de Toronto, la normativa, el papel de los compradores extranjeros y las posibles consecuencias para la economía mundial, teniendo en cuenta el declive del mercado inmobiliario chino y los controles de capital.

Guía completa sobre el uso de PostgreSQL en diversas aplicaciones y escenarios

  • El resumen proporciona una lista de herramientas y recursos para utilizar PostgreSQL en diversas aplicaciones y escenarios.
  • Incluye enlaces a repositorios de GitHub para ejemplos de código y más información sobre temas como trabajos en segundo plano y cron, colas de mensajes, SIG/mapeo, registros de auditoría, control de acceso, autorización, funciones de búsqueda, datos de series temporales, datos de gráficos, datos ajenos, interacciones HTTP, API, eventos/replicación/CDC, pruebas unitarias, migraciones, cuadros de mando/UI, visualización de datos y servidores de idiomas.
  • Invitamos a los lectores a compartir cualquier recurso o herramienta adicional que conozcan.

Reacciones

  • PostgreSQL es un sistema de gestión de bases de datos versátil, pero difícil, que se utiliza a menudo en el desarrollo de software.
  • El pasaje destaca las ventajas y limitaciones de utilizar PostgreSQL y recomienda aprovechar la tecnología existente siempre que sea posible.
  • Proporciona información sobre diversos patrones y bibliotecas para un uso eficaz, escalado, gestión de arquitecturas de aplicaciones complejas y comprensión de las ventajas y desventajas de las distintas bases de datos.

Reconocer los problemas y el progreso del mundo: Un camino hacia un futuro mejor

  • El artículo destaca la doble naturaleza del mundo, reconociendo que tiene aspectos negativos y áreas de progreso.
  • Utilizando la mortalidad infantil como ejemplo, el autor hace hincapié en las mejoras conseguidas al tiempo que reconoce los problemas existentes.
  • El artículo sostiene que reconocer tanto los problemas como los avances es crucial para creer en el potencial de un mundo mejor.

Reacciones

  • El debate profundiza en diversos temas como el estado mundial, el crecimiento demográfico y económico, el agotamiento de los recursos, el cambio climático, los índices de delincuencia y la polarización política.
  • Se presentan diferentes perspectivas, tanto optimistas como pesimistas, mostrando un enfoque equilibrado.
  • Se hace hincapié en la complejidad y los retos de estas cuestiones, así como en la importancia de disponer de datos fiables, tener una mentalidad abierta y participar en debates productivos.

GPT contra abogados: Los modelos lingüísticos superan a los humanos en las revisiones jurídicas

  • Se ha comprobado que los modelos lingüísticos extensos (LLM) son tan precisos como los revisores humanos de contratos jurídicos, o incluso los superan, a la hora de determinar cuestiones jurídicas.
  • Los LLM son significativamente más rápidos que los humanos, capaces de completar revisiones en segundos frente a horas.
  • El uso de los LLM en el sector jurídico tiene el potencial de revolucionar este campo, aumentando la accesibilidad y la eficiencia al tiempo que se reducen los costes.

Reacciones

  • La IA y los modelos lingüísticos (LLM) están siendo objeto de debate por su impacto en la profesión jurídica.
  • Hay opiniones encontradas sobre su eficacia y sus limitaciones: algunos sugieren su integración con los abogados, mientras que otros plantean problemas de precisión y responsabilidad.
  • La pérdida de puestos de trabajo en el sector jurídico y la necesidad de una normativa que lo proteja son también temas de debate. La privacidad, el uso indebido de los datos y la importancia de la aportación humana en los asuntos jurídicos son otras de las preocupaciones.

Lanzamiento de jQuery 4.0.0 Beta: Corrección de errores, mejoras de rendimiento y cambios de última hora

  • Se ha publicado la versión beta de jQuery 4.0.0, que incluye correcciones de errores, mejoras de rendimiento y algunos cambios de última hora.
  • En esta actualización se ha eliminado el soporte para IE con niños.
  • La Fundación jQuery ofrece diversos recursos, como formación, eventos, documentación, soporte y foros, para ayudar a los usuarios a aprender y contribuir a la comunidad jQuery.

Reacciones

  • Los participantes debaten la relevancia y la importancia de jQuery en el desarrollo web contemporáneo, en particular su carácter indispensable para los sitios web basados en WordPress.
  • Sus defensores destacan su sencillez y versatilidad para realizar diversas tareas.
  • Por el contrario, los defensores de los marcos de JavaScript modernos como React argumentan que la necesidad de jQuery es subjetiva en comparación con las tecnologías más nuevas.

Mejorando los Programas de Línea de Comandos: Modern Updates for UNIX Principles (2021)

  • El texto ofrece directrices para mejorar los programas de línea de comandos basadas en actualizaciones modernas de los principios tradicionales de UNIX.
  • Enfatiza la importancia de diseñar programas CLI con el usuario en mente y de adherirse a un buen diseño UI y a las convenciones CLI.
  • El documento explora el valor y los principios de diseño de las interfaces de línea de comandos, incluida la claridad, la facilidad de descubrimiento y el diseño human-first.

Reacciones

  • El artículo explora la situación actual y las ventajas de las interfaces de línea de comandos (CLI).
  • En la sección de comentarios se abordan diversos temas, como la importancia de la opción de "ejecución en seco" en los comandos, el comportamiento de los comandos cuando se canalizan o redirigen, los distintos enfoques para lanzar entornos y ejecutar código, la preferencia por las CLI anidadas frente a la visualización de todas las opciones en un único lugar y los retos de hacer que las CLI sean legibles tanto para humanos como para máquinas.
  • Las opiniones difieren sobre el futuro de la línea de comandos y el papel de la IA, pero se reconoce la utilización e importancia continuas de las CLI.

Bluesky abre su red social al público con nuevas funciones

  • Bluesky, una red social abierta, está ahora abierta a cualquiera sin necesidad de código de invitación.
  • La plataforma ha desarrollado funciones como herramientas de moderación y feeds personalizados.
  • Están experimentando con la "federación", cuyo objetivo es crear una red más abierta y personalizable en la que los desarrolladores puedan autoalojar un servidor.

Reacciones

  • Bluesky es una red social descentralizada cuyo objetivo es promover la federación abierta.
  • Se están haciendo comparaciones entre el modelo de negocio de Bluesky y el impacto de Netscape en el desarrollo web, aunque las opiniones sobre su importancia son dispares.
  • Se plantean preocupaciones sobre la sostenibilidad financiera de Bluesky y los retos de la monetización, así como los obstáculos técnicos, la portabilidad de cuentas, los cierres de servidores y la necesidad de regulación en la industria tecnológica.

AdGuard Home: servidor DNS de bloqueo de publicidad y rastreadores en toda la red

  • AdGuard Home es un software de red que bloquea la publicidad y el rastreo en todos los dispositivos de su hogar actuando como servidor DNS y redirigiendo los dominios de rastreo.
  • Ofrece funciones como listas de bloqueo personalizables, supervisión de la actividad de la red y la posibilidad de añadir reglas de filtrado personalizadas.
  • AdGuard Home es un proyecto de código abierto que puede instalarse utilizando varios métodos y no recopila estadísticas de uso a menos que se configure para ello.

Reacciones

  • Las discusiones de los usuarios se centran en la eficacia de varios servidores DNS de bloqueo de publicidad, como PiHole, NextDNS y AdGuard Home.
  • Los usuarios comparten sus experiencias sobre la compatibilidad, latencia y fiabilidad de los sitios web cuando utilizan estas herramientas.
  • También se debaten los problemas de privacidad, los precios y las opciones de personalización, con opiniones divergentes sobre la utilidad y las ventajas de las distintas soluciones de bloqueo de anuncios.

El calentamiento de los océanos supera los objetivos del Acuerdo de París, según un nuevo estudio

  • Las esponjas del Caribe han aportado pruebas históricas que demuestran que la temperatura de los océanos empezó a aumentar por la quema de combustibles fósiles en 1860, 80 años antes de lo que se creía.
  • Las temperaturas actuales ya son 1,7 °C más cálidas que los niveles preindustriales, superando los objetivos fijados por el Acuerdo de París.
  • El estudio subraya la importancia de utilizar datos paleoclimáticos para complementar los registros instrumentales y pide que se reevalúe el periodo de referencia preindustrial utilizado por el IPCC.

Reacciones

  • Este resumen ofrece una visión general de diversos temas relacionados con el cambio climático, como el calentamiento de los océanos, la falta de apoyo democrático y la oposición de la industria.
  • Destaca la necesidad de cambios de comportamiento y de infraestructuras, así como de abordar los impactos y costes desiguales del cambio climático.
  • También se analiza el papel de las energías renovables, las emisiones de China y la reducción del consumo de carbono, junto con el potencial de los coches eléctricos como solución.

Mozilla Monitor Plus: Eliminación automática de datos y protección de la privacidad

  • Mozilla Monitor, antes conocido como Firefox Monitor, ha introducido un nuevo servicio de suscripción de pago llamado Monitor Plus.
  • Monitor Plus ofrece a los usuarios la eliminación automática de datos y la supervisión continua de la información personal que se ha visto comprometida en violaciones de datos.
  • El servicio permite a los usuarios tomar el control de su privacidad en línea, permitiéndoles solicitar cambios o la eliminación de sus datos personales de los sitios de intermediarios de datos, recibir alertas de infracciones y hacer que se elimine su información de más de 190 sitios de intermediarios de datos.

Reacciones

  • Mozilla ha lanzado un nuevo servicio llamado Mozilla Monitor Plus que elimina automáticamente la información personal de los intermediarios de datos.
  • Se ha expresado preocupación por la posibilidad de que se proporcione más información a los intermediarios de datos, pero Mozilla aborda esta cuestión en su política de privacidad.
  • La aplicación de una solución que utilice un filtro bloom se considera poco probable.
  • En los comentarios se discuten las limitaciones de los servicios centralizados de protección de datos y se introduce el concepto de minimización de nombres de consulta en DNS.
  • Otros servicios como Optery, OneRep e Incogni se mencionan y comparan en términos de características y precios.
  • Algunos usuarios se muestran satisfechos con Optery, mientras que a otros les preocupan las asociaciones de afiliados y los scripts de terceros.
  • La conversación también incluye debates sobre Firefox Relay y proveedores alternativos para la protección de la privacidad.
  • La normativa de la UE plantea dificultades para ofrecer determinados servicios.
  • También se debaten los precios, la eficacia de la eliminación de datos y la preocupación por la privacidad y la seguridad de los datos.
  • Algunos usuarios expresan su desconfianza en Mozilla y critican las decisiones de gestión de la empresa.
  • También se critica que se cobre a la gente por eliminar su información personal.
  • El debate general abarca una amplia gama de temas relacionados con la protección de la privacidad y la eliminación de datos de los intermediarios.

Go 1.22: nuevas funciones, optimizaciones y actualizaciones de la plataforma

  • Go 1.22 es la última versión del lenguaje de programación Go, que aporta mejoras y cambios en varios aspectos, como la cadena de herramientas, el tiempo de ejecución y las bibliotecas.
  • Las actualizaciones incluyen mejoras en la interfaz de usuario web de la herramienta de rastreo, avisos mejorados en la herramienta vet, optimización en la recogida de basura y reducción de la sobrecarga de memoria.
  • La versión introduce nuevos paquetes, actualizaciones de paquetes existentes y cambios en paquetes como encoding/json, go/ast y database/sql. También se incluyen actualizaciones específicas de plataforma, como ejecutables independientes de la posición en macOS y compatibilidad con loong64 port y OpenBSD en PowerPC big-endian de 64 bits.

Reacciones

  • La conversación gira en torno a lenguajes de programación como Typescript, Go y Dart, discutiendo sus ventajas, retos y estándares de codificación.
  • Las actualizaciones y cambios en Go, como la adición de la función "sql.Null[T]" y las mejoras en la biblioteca estándar, son discutidas y apreciadas por la comunidad.
  • Los participantes comparten sus experiencias y opiniones sobre el diseño de idiomas y la actualización a versiones más recientes, aportando valiosas ideas a la conversación.

Daños millonarios al realizar un ataque DDoS suizo un cepillo de dientes inteligente infectado con 3M

  • Unos piratas informáticos han infectado aproximadamente tres millones de cepillos de dientes inteligentes en Suiza y los han utilizado para lanzar un ataque DDoS contra el sitio web de una empresa.
  • La empresa sufrió daños por valor de millones de euros como consecuencia del ataque.
  • Los cepillos de dientes eran vulnerables a la brecha debido a su sistema operativo basado en Java.
  • Los expertos en ciberseguridad recomiendan a los propietarios de los dispositivos que los actualicen, vigilen cualquier actividad sospechosa y utilicen software de seguridad para protegerse de ataques similares.

Reacciones

  • El debate explora los riesgos de seguridad y las preocupaciones en torno a los cepillos de dientes y los dispositivos inteligentes conectados a Internet.
  • Los participantes cuestionan la validez de un artículo periodístico que sugiere la utilización de cepillos de dientes inteligentes en ataques DDoS.
  • Se plantean diversas preocupaciones, como la seguridad de los dispositivos, la privacidad de los datos, la posible vigilancia y la importancia de mejorar las medidas de seguridad de los dispositivos inteligentes.

Priorizar la importancia de los servidores: La necesidad de un seguimiento regular

  • La sala de máquinas principal del autor sufrió un grave fallo en el aire acondicionado, lo que obligó a apagar las máquinas.
  • El incidente puso de manifiesto la necesidad de controlar qué máquinas son críticas y cuáles no, para planificar mejor futuras limitaciones de refrigeración o energía.
  • Aunque el autor reconoció la importancia de documentar esta información, mencionó que puede que no se le dé prioridad debido al trabajo de mantenimiento en curso.

Reacciones

  • El pasaje y el hilo de comentarios abarcan temas como la gestión de servidores, los centros de datos y la infraestructura informática.
  • Entre los temas clave figuran la importancia de la gestión de activos y los índices de criticidad y el tratamiento de los servidores como ganado, no como animales domésticos.
  • El debate profundiza en los retos que plantea la aplicación de este enfoque, el uso de servicios en la nube, la necesidad de redundancia y resistencia del sistema de servidores, así como las limitaciones, los costes, las restricciones presupuestarias en el mundo académico y la importancia de la documentación y la organización.