Aller au contenu principal

2024-02-07

Guide complet de SQL pour les scientifiques de données : 100 requêtes et exemples

  • Les informations fournies constituent une ressource complète pour enseigner SQL aux formateurs, couvrant des sujets tels que la gestion des bases de données, les requêtes SQL, la jointure de données, les fonctions de fenêtrage, les transactions, les déclencheurs, la manipulation de données JSON et l'interaction de Python avec les bases de données.
  • Le matériel comprend des instructions d'installation, des concepts de base et des exemples de requêtes SQL avec leurs résultats pour différents scénarios.
  • Il couvre également des concepts tels que les fonctions d'agrégation, les contraintes, l'upsert, la normalisation, et fournit des extraits de code démontrant l'utilisation de SQLite et de Python, y compris la gestion des exceptions, le travail avec les dates et les heures, l'utilisation de SQL dans les carnets Jupyter, et l'utilisation de Pandas avec SQLite. Une liste de termes clés liés aux bases de données et à SQL est également incluse.

Réactions

  • Le résumé couvre les discussions sur la science des données, SQL et les sujets connexes, explorant la définition et les attentes du rôle de scientifique des données.
  • Elle met en évidence la confusion qui règne autour des différents titres et des attentes dans ce domaine.
  • L'utilité d'outils tels que ChatGPT pour écrire des requêtes SQL en anglais simple est discutée, ainsi que les défis liés à l'utilisation de Clickhouse pour les jointures SQL et le travail avec des données de séries temporelles.
  • Des recommandations sont fournies pour des tutoriels SQL, des ressources pour l'optimisation des requêtes et une suggestion d'utiliser DuckDB.

Une fuite de la banque HSBC révèle l'existence de prêts hypothécaires frauduleux financés par de faux revenus chinois dans l'immobilier à Toronto

  • Un dénonciateur de la banque HSBC au Canada a découvert des preuves de prêts hypothécaires frauduleux à Toronto, impliquant de faux revenus chinois et estimés à plus de 500 millions de dollars.
  • Ces prêts immobiliers frauduleux ont été émis par au moins 10 succursales HSBC dans la région de Toronto depuis 2015, avec une augmentation pendant la pandémie de Covid-19.
  • Les acheteurs chinois de la diaspora obtenaient des prêts hypothécaires auprès de HSBC tout en déclarant des salaires extravagants provenant d'emplois à distance en Chine, en utilisant de faux documents pour blanchir de l'argent.

Réactions

  • La banque HSBC au Canada serait impliquée dans l'émission frauduleuse de prêts hypothécaires à des acheteurs de la diaspora chinoise à Toronto, impliquant probablement des employés et un cadre supérieur.
  • Le problème pourrait dépasser le cadre d'une seule agence et s'étendre à l'ensemble de la banque, suscitant des inquiétudes quant au blanchiment d'argent, à la fraude, au gonflement des prix de l'immobilier et aux risques potentiels pour le système bancaire canadien.
  • La discussion porte également sur l'impact des revenus non imposés sur le marché immobilier de Toronto, les réglementations, le rôle des acheteurs étrangers et les conséquences potentielles pour l'économie mondiale, compte tenu du déclin du marché immobilier chinois et des contrôles de capitaux.

Un guide complet sur l'utilisation de PostgreSQL dans diverses applications et scénarios

  • Le résumé fournit une liste d'outils et de ressources permettant d'utiliser PostgreSQL dans diverses applications et scénarios.
  • Il comprend des liens vers des dépôts GitHub pour des exemples de code et des informations complémentaires sur des sujets tels que les tâches d'arrière-plan et cron, les files d'attente de messages, le SIG/la cartographie, les journaux d'audit, le contrôle d'accès, l'autorisation, la fonctionnalité de recherche, les données de séries chronologiques, les données graphiques, les données étrangères, les interactions HTTP, les API, les événements/la réplication/le CDC, les tests unitaires, les migrations, les tableaux de bord/les interfaces utilisateur, la visualisation des données et les serveurs de langues.
  • Les lecteurs sont invités à partager toute ressource ou outil supplémentaire dont ils pourraient avoir connaissance.

Réactions

  • PostgreSQL est un système de gestion de base de données polyvalent mais complexe, souvent utilisé dans le développement de logiciels.
  • Le passage souligne les avantages et les limites de l'utilisation de PostgreSQL et recommande de tirer parti de la technologie existante dans la mesure du possible.
  • Il donne un aperçu des différents modèles et bibliothèques pour une utilisation efficace, une mise à l'échelle, la gestion d'architectures d'applications complexes et la compréhension des compromis entre les différentes bases de données.

Reconnaître les problèmes et les progrès du monde : Une voie vers un avenir meilleur

  • L'article souligne la double nature du monde, reconnaissant qu'il comporte à la fois des aspects négatifs et des domaines de progrès.
  • En prenant l'exemple de la mortalité infantile, l'auteur met l'accent sur les améliorations apportées tout en reconnaissant les problèmes existants.
  • L'article affirme qu'il est essentiel de reconnaître à la fois les problèmes et les progrès pour croire au potentiel d'un monde meilleur.

Réactions

  • La discussion porte sur divers sujets tels que l'état de la planète, la croissance démographique et économique, l'épuisement des ressources, le changement climatique, les taux de criminalité et la polarisation politique.
  • Différentes perspectives, tant optimistes que pessimistes, sont présentées, mettant en évidence une approche équilibrée.
  • La complexité et les défis qui entourent ces questions sont soulignés, de même que l'importance de disposer de données fiables, de faire preuve d'ouverture d'esprit et de s'engager dans des débats productifs.

GPT contre les avocats : Les modèles linguistiques sont plus performants que les humains dans les examens juridiques

  • Les grands modèles de langage (LLM) se sont révélés aussi précis, voire plus, que les réviseurs de contrats juridiques humains pour déterminer les questions juridiques.
  • Les LLM sont nettement plus rapides que les humains, capables de réaliser des examens en quelques secondes au lieu de plusieurs heures.
  • L'utilisation des LLM dans l'industrie juridique peut révolutionner le domaine, en augmentant l'accessibilité et l'efficacité tout en réduisant les coûts.

Réactions

  • L'IA et les modèles linguistiques (LLM) font l'objet de discussions quant à leur impact sur la profession juridique.
  • Les avis sont partagés quant à leur efficacité et à leurs limites, certains suggérant une intégration avec les avocats, d'autres s'inquiétant de l'exactitude des données et des questions de responsabilité.
  • La perte d'emplois dans le secteur juridique et la nécessité d'une réglementation pour le protéger font également l'objet d'un débat. La protection de la vie privée, l'utilisation abusive des données et l'importance de l'intervention humaine dans les affaires juridiques sont d'autres préoccupations.

Version bêta de jQuery 4.0.0 : Corrections de bugs, améliorations des performances et ruptures

  • La version beta de jQuery 4.0.0 a été publiée, apportant des corrections de bugs, des améliorations de performance et quelques changements.
  • La prise en charge de l'IE avec des enfants a été supprimée dans cette mise à jour.
  • La Fondation jQuery propose diverses ressources, notamment des formations, des événements, de la documentation, de l'assistance et des forums, afin d'aider les utilisateurs à apprendre et à contribuer à la communauté jQuery.

Réactions

  • Les participants débattent de la pertinence et de l'importance de jQuery dans le développement web contemporain, en particulier de son caractère indispensable pour les sites web basés sur WordPress.
  • Ses défenseurs soulignent sa simplicité et sa polyvalence dans la gestion de diverses tâches.
  • À l'inverse, les partisans des frameworks JavaScript modernes tels que React affirment que la nécessité de jQuery est subjective par rapport aux technologies plus récentes.

Améliorer les programmes en ligne de commande : Mises à jour modernes pour les principes UNIX (2021)

  • Le texte fournit des lignes directrices pour l'amélioration des programmes en ligne de commande, basées sur des mises à jour modernes des principes traditionnels d'UNIX.
  • Il souligne l'importance de concevoir des programmes CLI en gardant l'utilisateur à l'esprit et en adhérant à une bonne conception de l'interface utilisateur et aux conventions CLI.
  • Le document explore la valeur et les principes de conception des interfaces de ligne de commande, notamment la clarté, la facilité de découverte et la conception centrée sur l'humain.

Réactions

  • L'article explore le statut actuel et les avantages des interfaces de ligne de commande (CLI).
  • La section des commentaires couvre un large éventail de sujets, tels que l'importance d'une option "dry run" dans les commandes, le comportement des commandes lorsqu'elles sont acheminées ou redirigées, les différentes approches pour lancer les environnements et exécuter le code, la préférence pour les CLI imbriquées par rapport à l'affichage de toutes les options en un seul endroit, et les défis liés à la lisibilité des CLI pour les humains et les machines.
  • Les avis divergent quant à l'avenir de la ligne de commande et au rôle de l'IA, mais l'utilisation et l'importance des CLI sont reconnues.

Bluesky ouvre son réseau social au public avec de nouvelles fonctionnalités

  • Bluesky, un réseau social ouvert, est désormais accessible à tous sans code d'invitation.
  • La plateforme a développé des fonctionnalités telles que des outils de modération et des flux personnalisés.
  • Ils expérimentent la "fédération", qui vise à créer un réseau plus ouvert et personnalisable où les développeurs peuvent héberger eux-mêmes un serveur.

Réactions

  • Bluesky est un réseau social décentralisé qui vise à promouvoir une fédération ouverte.
  • Des comparaisons sont faites entre le modèle d'entreprise de Bluesky et l'impact de Netscape sur le développement du web, bien que les avis sur son importance soient partagés.
  • Des inquiétudes sont exprimées quant à la viabilité financière de Bluesky et aux défis de la monétisation, ainsi qu'aux obstacles techniques, à la portabilité des comptes, aux fermetures de serveurs et à la nécessité d'une réglementation dans l'industrie technologique.

AdGuard Home : Serveur DNS bloquant les publicités et les traqueurs sur l'ensemble du réseau

  • AdGuard Home est un logiciel de réseau qui bloque les publicités et le pistage sur tous les appareils de votre domicile en agissant comme un serveur DNS et en détournant les domaines de pistage.
  • Il offre des fonctionnalités telles que des listes de blocage personnalisables, la surveillance de l'activité du réseau et la possibilité d'ajouter des règles de filtrage personnalisées.
  • AdGuard Home est un projet open-source qui peut être installé à l'aide de différentes méthodes et qui ne collecte pas de statistiques d'utilisation, sauf s'il est configuré pour le faire.

Réactions

  • Les discussions des utilisateurs portent sur l'efficacité de divers serveurs DNS bloquant la publicité, tels que PiHole, NextDNS et AdGuard Home.
  • Les utilisateurs partagent leurs expériences concernant la compatibilité des sites web, la latence et la fiabilité lors de l'utilisation de ces outils.
  • Les problèmes de confidentialité, les prix et les options de personnalisation sont également abordés, avec des opinions divergentes sur l'utilité et les avantages des différentes solutions de blocage des publicités.

Le réchauffement des océans dépasse les objectifs de l'accord de Paris, selon une nouvelle étude

  • Des éponges des Caraïbes ont fourni des preuves historiques montrant que la température des océans a commencé à augmenter en raison de la combustion de combustibles fossiles en 1860, soit 80 ans plus tôt que ce que l'on pensait auparavant.
  • Les températures actuelles sont déjà supérieures de 1,7 °C aux niveaux préindustriels, dépassant les objectifs fixés par l'Accord de Paris.
  • L'étude souligne l'importance d'utiliser les données paléoclimatiques pour compléter les enregistrements instrumentaux et appelle à une réévaluation de la période de référence préindustrielle utilisée par le GIEC.

Réactions

  • Ce résumé donne un aperçu de divers sujets liés au changement climatique, tels que le réchauffement des océans, le manque de soutien démocratique et l'opposition de l'industrie.
  • Il souligne la nécessité de modifier les comportements et les infrastructures, et de s'attaquer aux effets et aux coûts inégaux du changement climatique.
  • Le rôle des énergies renouvelables, les émissions de la Chine et la réduction de la consommation de carbone sont également abordés, ainsi que le potentiel des voitures électriques en tant que solution.

Mozilla Monitor Plus : Suppression automatique des données et protection de la vie privée

  • Mozilla Monitor, anciennement connu sous le nom de Firefox Monitor, a introduit un nouveau service d'abonnement payant appelé Monitor Plus.
  • Monitor Plus permet aux utilisateurs de supprimer automatiquement les données et de surveiller en permanence les informations personnelles qui ont été compromises lors de violations de données.
  • Ce service permet aux utilisateurs de prendre le contrôle de leur vie privée en ligne en leur permettant de demander la modification ou la suppression de leurs données personnelles sur les sites de courtiers en données, de recevoir des alertes en cas de violation et de faire supprimer leurs informations de plus de 190 sites de courtiers en données.

Réactions

  • Mozilla a lancé un nouveau service appelé Mozilla Monitor Plus qui supprime automatiquement les informations personnelles des courtiers en données.
  • Des inquiétudes ont été soulevées quant à la possibilité de fournir davantage d'informations aux courtiers en données, mais Mozilla aborde cette question dans sa politique de confidentialité.
  • La mise en œuvre d'une solution utilisant un filtre Bloom est considérée comme improbable.
  • Les commentaires discutent des limites des services centralisés de protection des données et introduisent le concept de minimisation des noms de requête dans le DNS.
  • D'autres services comme Optery, OneRep et Incogni sont mentionnés et comparés en termes de fonctionnalités et de prix.
  • Certains utilisateurs se disent satisfaits d'Optery, tandis que d'autres s'inquiètent des partenariats d'affiliation et des scripts tiers.
  • La conversation porte également sur Firefox Relay et les fournisseurs alternatifs de protection de la vie privée.
  • Les réglementations de l'UE posent des problèmes pour l'offre de certains services.
  • La tarification, l'efficacité de la suppression des données et les préoccupations relatives à la protection de la vie privée et à la sécurité des données sont également abordées.
  • Certains utilisateurs expriment leur méfiance à l'égard de Mozilla et critiquent les décisions de gestion de l'entreprise.
  • Il y a également des critiques concernant le fait de faire payer les gens pour qu'ils suppriment leurs informations personnelles.
  • La discussion générale couvre un large éventail de sujets liés à la protection de la vie privée et à la suppression des données des courtiers en données.

Go 1.22 : Nouvelles fonctionnalités, optimisations et mises à jour de la plateforme

  • Go 1.22 est la dernière version du langage de programmation Go, qui apporte des améliorations et des changements sur différents aspects tels que la chaîne d'outils, le moteur d'exécution et les bibliothèques.
  • Les mises à jour comprennent des améliorations de l'interface utilisateur web de l'outil de suivi, des avertissements améliorés dans l'outil de suivi, une optimisation de la collecte des déchets et une réduction de l'encombrement de la mémoire.
  • Cette version introduit de nouveaux paquets, des mises à jour de paquets existants et des changements dans des paquets tels que encoding/json, go/ast et database/sql. Des mises à jour spécifiques aux plateformes sont également incluses, comme les exécutables indépendants de la position sur macOS et le support du port loong64 et d'OpenBSD sur le PowerPC 64 bits big-endian.

Réactions

  • La conversation porte sur des langages de programmation tels que Typescript, Go et Dart, dont les avantages, les défis et les normes de codage sont abordés.
  • Les mises à jour et les changements dans Go, tels que l'ajout de la fonctionnalité "sql.Null[T]" et les améliorations dans la bibliothèque standard, sont discutés et appréciés par la communauté.
  • Les participants partagent leurs expériences et leurs opinions sur la conception des langues et la mise à niveau vers de nouvelles versions, apportant ainsi des informations précieuses à la conversation.

Des millions de dollars de dommages : des brosses à dents intelligentes infectées par 3M mènent une attaque DDoS en Suisse

  • Des pirates informatiques ont infecté environ trois millions de brosses à dents intelligentes en Suisse et les ont utilisées pour lancer une attaque DDoS sur le site web d'une entreprise.
  • L'entreprise a subi des millions d'euros de dommages à la suite de cette attaque.
  • Les brosses à dents étaient vulnérables à la violation en raison de leur système d'exploitation basé sur Java.
  • Les experts en cybersécurité recommandent aux propriétaires d'appareils de les mettre à jour, de surveiller toute activité suspecte et d'utiliser des logiciels de sécurité pour se prémunir contre des attaques similaires.

Réactions

  • La discussion porte sur les risques de sécurité et les préoccupations concernant les brosses à dents et les appareils intelligents connectés à l'internet.
  • Les participants s'interrogent sur la validité d'un article de presse suggérant que des brosses à dents intelligentes ont été utilisées dans des attaques DDoS.
  • Diverses préoccupations sont soulevées, notamment la sécurité des appareils, la confidentialité des données, la surveillance potentielle et l'importance de meilleures mesures de sécurité pour les appareils intelligents.

Priorité à l'importance des serveurs : Nécessité d'un suivi régulier

  • La salle des machines principale de l'auteur a connu une panne majeure de climatisation, l'obligeant à éteindre les machines.
  • L'incident a mis en évidence la nécessité de savoir quelles machines sont critiques et lesquelles ne le sont pas, afin de mieux planifier les limitations futures en matière de refroidissement ou d'alimentation.
  • Tout en reconnaissant l'importance de documenter ces informations, l'auteur a indiqué qu'elles risquaient de ne pas être prioritaires en raison des travaux de maintenance en cours.

Réactions

  • Le passage et le fil de commentaires couvrent des sujets tels que la gestion des serveurs, les centres de données et l'infrastructure informatique.
  • Parmi les thèmes clés, citons l'importance de la gestion des actifs et de l'évaluation de la criticité, ainsi que le fait de traiter les serveurs comme du bétail et non comme des animaux domestiques.
  • La discussion porte sur les défis liés à la mise en œuvre de cette approche, l'utilisation de services en nuage, la nécessité d'une redondance et d'une résilience du système de serveur, ainsi que sur les limitations, les coûts, les contraintes budgétaires dans les universités et l'importance de la documentation et de l'organisation.