Passa al contenuto principale

2024-02-07

Guida completa all'SQL per scienziati dei dati: 100 query ed esempi

  • Le informazioni fornite sono una risorsa completa per l'insegnamento dell'SQL agli istruttori e coprono argomenti come la gestione dei database, le query SQL, l'unione dei dati, le funzioni di windowing, le transazioni, i trigger, la manipolazione dei dati JSON e l'interazione di Python con i database.
  • Il materiale comprende istruzioni per la configurazione, concetti di base ed esempi di query SQL con i relativi risultati per diversi scenari.
  • Vengono inoltre illustrati concetti come le funzioni di aggregazione, i vincoli, l'upsert, la normalizzazione e vengono forniti frammenti di codice che dimostrano l'utilizzo di SQLite e Python, tra cui la gestione delle eccezioni, il lavoro con date e orari, l'uso di SQL in Jupyter notebook e l'utilizzo di Pandas con SQLite. È incluso anche un elenco di termini chiave relativi a database e SQL.

Reazioni

  • La sintesi copre le discussioni sulla scienza dei dati, su SQL e su argomenti correlati, esplorando la definizione e le aspettative del ruolo di data scientist.
  • Evidenzia la confusione sui diversi titoli e sulle aspettative all'interno del settore.
  • Viene discussa l'utilità di strumenti come ChatGPT per la scrittura di query SQL in inglese semplice, nonché le sfide nell'uso di Clickhouse per le giunzioni SQL e per lavorare con i dati delle serie temporali.
  • Vengono forniti consigli su tutorial SQL, risorse per l'ottimizzazione delle query e un suggerimento sull'uso di DuckDB.

La fuga di notizie della banca HSBC espone mutui fraudolenti alimentati da falsi redditi cinesi nel settore immobiliare di Toronto

  • Un informatore della banca HSBC in Canada ha scoperto prove di mutui fraudolenti a Toronto, che coinvolgono falsi redditi cinesi e che sono stimati in oltre 500 milioni di dollari.
  • Questi mutui fraudolenti sono stati emessi da almeno 10 filiali HSBC nell'area di Toronto a partire dal 2015, con un incremento durante la pandemia Covid-19.
  • Gli acquirenti cinesi della diaspora ottenevano mutui da HSBC e al contempo dichiaravano stipendi stravaganti da lavori a distanza in Cina, utilizzando documenti falsi per riciclare il denaro.

Reazioni

  • La banca canadese HSBC è presumibilmente coinvolta in un'emissione fraudolenta di mutui ipotecari a favore di acquirenti cinesi della diaspora a Toronto, forse con il coinvolgimento di dipendenti e di un dirigente.
  • Il problema potrebbe andare oltre una filiale e diffondersi in tutta la banca, sollevando preoccupazioni per il riciclaggio di denaro, le frodi, i prezzi gonfiati delle case e i potenziali rischi per il sistema bancario canadese.
  • La discussione si concentra anche sull'impatto del reddito non tassato sul mercato immobiliare di Toronto, sulle normative, sul ruolo degli acquirenti stranieri e sulle potenziali conseguenze per l'economia globale, considerando il declino del mercato immobiliare cinese e i controlli sui capitali.

Una guida completa all'uso di PostgreSQL in diverse applicazioni e scenari

  • Il sommario fornisce un elenco di strumenti e risorse per l'utilizzo di PostgreSQL in varie applicazioni e scenari.
  • Include collegamenti ai repository GitHub per esempi di codice e ulteriori informazioni su argomenti quali lavori in background e cron, code di messaggi, GIS/mapping, registri di audit, controllo degli accessi, autorizzazioni, funzionalità di ricerca, dati di serie temporali, dati di grafici, dati esteri, interazioni HTTP, API, eventi/repliche/CDC, test unitari, migrazioni, dashboard/UI, visualizzazione dei dati e server linguistici.
  • I lettori sono invitati a condividere qualsiasi altra risorsa o strumento di cui siano a conoscenza.

Reazioni

  • PostgreSQL è un sistema di gestione di database versatile ma impegnativo, spesso utilizzato nello sviluppo di software.
  • Il brano evidenzia i vantaggi e i limiti dell'uso di PostgreSQL e raccomanda di sfruttare la tecnologia esistente quando possibile.
  • Fornisce approfondimenti su vari modelli e librerie per l'utilizzo efficace, la scalabilità, la gestione di architetture applicative complesse e la comprensione dei compromessi tra i diversi database.

Riconoscere i problemi e i progressi del mondo: Un percorso verso un futuro migliore

  • L'articolo evidenzia la duplice natura del mondo, riconoscendo che presenta sia aspetti negativi che aree di progresso.
  • Utilizzando la mortalità infantile come esempio, l'autore sottolinea i miglioramenti fatti pur riconoscendo i problemi esistenti.
  • L'articolo sostiene che riconoscere sia i problemi che i progressi è fondamentale per credere nel potenziale di un mondo migliore.

Reazioni

  • La discussione approfondisce vari temi come lo stato globale, la crescita demografica ed economica, l'esaurimento delle risorse, il cambiamento climatico, i tassi di criminalità e la polarizzazione politica.
  • Vengono presentate diverse prospettive, sia ottimistiche che pessimistiche, mostrando un approccio equilibrato.
  • Vengono sottolineate la complessità e le sfide che circondano questi temi, nonché l'importanza di disporre di dati affidabili, di avere una mentalità aperta e di impegnarsi in dibattiti produttivi.

GPT contro avvocati: I modelli linguistici superano gli esseri umani nelle revisioni legali

  • È stato riscontrato che i modelli linguistici di grandi dimensioni (LLM) sono altrettanto accurati o addirittura superiori ai revisori legali umani dei contratti nel determinare le questioni legali.
  • I LLM sono molto più veloci degli esseri umani e sono in grado di completare le revisioni in pochi secondi anziché in ore.
  • L'uso dei LLM nell'industria legale ha il potenziale per rivoluzionare il settore, aumentando l'accessibilità e l'efficienza e riducendo i costi.

Reazioni

  • L'intelligenza artificiale e i modelli linguistici (LLM) sono oggetto di discussione per il loro impatto sulla professione legale.
  • Ci sono opinioni contrastanti sulla loro efficacia e sui loro limiti: alcuni suggeriscono l'integrazione con gli avvocati, mentre altri sollevano dubbi sull'accuratezza e sui problemi di responsabilità.
  • Anche la perdita di posti di lavoro nell'industria legale e la necessità di norme che la tutelino sono oggetto di dibattito. La privacy, l'uso improprio dei dati e l'importanza del contributo umano nelle questioni legali sono ulteriori preoccupazioni.

jQuery 4.0.0 Beta Release: Correzioni di bug, miglioramenti delle prestazioni e cambiamenti radicali

  • È stata rilasciata la versione beta di jQuery 4.0.0, che apporta correzioni di bug, miglioramenti delle prestazioni e alcune modifiche di rottura.
  • Il supporto per IE con bambini è stato rimosso in questo aggiornamento.
  • La jQuery Foundation offre diverse risorse, tra cui formazione, eventi, documentazione, supporto e forum, per aiutare gli utenti a imparare e a contribuire alla comunità jQuery.

Reazioni

  • I partecipanti discutono la rilevanza e il significato di jQuery nello sviluppo web contemporaneo, in particolare la sua indispensabilità per i siti web basati su WordPress.
  • I sostenitori ne sottolineano la semplicità e la versatilità nel gestire diversi compiti.
  • Al contrario, i sostenitori dei moderni framework JavaScript come React sostengono che la necessità di jQuery è soggettiva se confrontata con le tecnologie più recenti.

Migliorare i programmi a riga di comando: Aggiornamenti moderni per i principi UNIX (2021)

  • Il testo fornisce linee guida per il miglioramento dei programmi a riga di comando, basate su moderni aggiornamenti dei principi UNIX tradizionali.
  • Sottolinea l'importanza di progettare i programmi CLI tenendo conto dell'utente e aderendo a un buon design dell'interfaccia utente e alle convenzioni CLI.
  • Il documento esplora il valore e i principi di progettazione delle interfacce a riga di comando, tra cui la chiarezza, la scopribilità e la progettazione a misura d'uomo.

Reazioni

  • L'articolo esplora lo stato attuale e i vantaggi delle interfacce a riga di comando (CLI).
  • La sezione dei commenti tratta una serie di argomenti, come il significato dell'opzione "dry run" nei comandi, il comportamento dei comandi quando vengono convogliati o reindirizzati, i diversi approcci all'avvio degli ambienti e all'esecuzione del codice, la preferenza per le CLI annidate rispetto alla visualizzazione di tutte le opzioni in un unico punto e le sfide di rendere le CLI leggibili sia dall'uomo che dalla macchina.
  • Le opinioni sul futuro della riga di comando e sul ruolo dell'intelligenza artificiale sono diverse, ma si riconosce l'uso e l'importanza continui delle CLI.

Bluesky apre il social network al pubblico con nuove funzionalità

  • Bluesky, un social network aperto, è ora aperto a tutti senza richiedere un codice di invito.
  • La piattaforma sta sviluppando funzionalità come strumenti di moderazione e feed personalizzati.
  • Stanno sperimentando la "federazione", che mira a creare una rete più aperta e personalizzabile in cui gli sviluppatori possano ospitare autonomamente un server.

Reazioni

  • Bluesky è un social network decentralizzato che mira a promuovere una federazione aperta.
  • Sono stati fatti paragoni tra il modello di business di Bluesky e l'impatto di Netscape sullo sviluppo del web, anche se le opinioni sulla sua importanza sono contrastanti.
  • Vengono sollevate preoccupazioni sulla sostenibilità finanziaria di Bluesky e sulle sfide della monetizzazione, oltre che sugli ostacoli tecnici, sulla portabilità degli account, sulla chiusura dei server e sulla necessità di una regolamentazione del settore tecnologico.

AdGuard Home: server DNS per il blocco di annunci e tracker a livello di rete

  • AdGuard Home è un software a livello di rete che blocca gli annunci e il tracciamento su tutti i dispositivi della casa agendo come server DNS e reindirizzando i domini di tracciamento.
  • Offre funzioni quali liste di blocco personalizzabili, monitoraggio delle attività di rete e possibilità di aggiungere regole di filtraggio personalizzate.
  • AdGuard Home è un progetto open-source che può essere installato con vari metodi e non raccoglie statistiche di utilizzo a meno che non sia configurato per farlo.

Reazioni

  • Le discussioni degli utenti vertono sull'efficacia di vari server DNS ad-blocking, come PiHole, NextDNS e AdGuard Home.
  • Gli utenti condividono le loro esperienze in merito alla compatibilità, alla latenza e all'affidabilità dei siti web quando utilizzano questi strumenti.
  • Vengono inoltre discussi i problemi di privacy, i prezzi e le opzioni di personalizzazione, con opinioni diverse sull'utilità e i vantaggi delle diverse soluzioni di blocco degli annunci.

Il riscaldamento degli oceani supera gli obiettivi dell'Accordo di Parigi, come dimostra un nuovo studio

  • Le spugne dei Caraibi hanno fornito prove storiche che dimostrano che le temperature degli oceani hanno iniziato ad aumentare a causa della combustione di combustibili fossili nel 1860, 80 anni prima di quanto ritenuto in precedenza.
  • Le temperature attuali sono già più calde di 1,7°C rispetto ai livelli preindustriali, superando gli obiettivi fissati dall'Accordo di Parigi.
  • Lo studio sottolinea l'importanza di utilizzare i dati paleoclimatici per integrare le registrazioni strumentali e invita a rivalutare il periodo di riferimento preindustriale utilizzato dall'IPCC.

Reazioni

  • Questa sintesi fornisce una panoramica di vari argomenti legati al cambiamento climatico, come il riscaldamento degli oceani, la mancanza di sostegno democratico e l'opposizione dell'industria.
  • Il documento evidenzia la necessità di modificare i comportamenti e le infrastrutture e di affrontare gli impatti e i costi diseguali del cambiamento climatico.
  • Si discute anche del ruolo delle energie rinnovabili, delle emissioni della Cina e della riduzione del consumo di carbonio, oltre che del potenziale delle auto elettriche come soluzione.

Mozilla Monitor Plus: Rimozione automatica dei dati e protezione della privacy

  • Mozilla Monitor, precedentemente noto come Firefox Monitor, ha introdotto un nuovo servizio di abbonamento a pagamento chiamato Monitor Plus.
  • Monitor Plus offre agli utenti la rimozione automatica dei dati e il monitoraggio continuo delle informazioni personali che sono state compromesse da violazioni dei dati.
  • Il servizio consente agli utenti di assumere il controllo della propria privacy online, permettendo loro di richiedere la modifica o la cancellazione dei propri dati personali dai siti di intermediazione dati, di ricevere avvisi di violazione e di far rimuovere le proprie informazioni da oltre 190 siti di intermediazione dati.

Reazioni

  • Mozilla ha lanciato un nuovo servizio chiamato Mozilla Monitor Plus che rimuove automaticamente le informazioni personali dagli intermediari di dati.
  • Sono state sollevate preoccupazioni sul fatto di fornire potenzialmente più informazioni agli intermediari di dati, ma Mozilla affronta la questione nella sua politica sulla privacy.
  • L'implementazione di una soluzione che utilizzi un filtro bloom è considerata improbabile.
  • I commenti discutono i limiti dei servizi di protezione dei dati centralizzati e introducono il concetto di minimizzazione dei nomi delle query nel DNS.
  • Altri servizi come Optery, OneRep e Incogni vengono citati e confrontati in termini di caratteristiche e prezzi.
  • Alcuni utenti si dichiarano soddisfatti di Optery, mentre altri sono preoccupati per le partnership di affiliazione e gli script di terze parti.
  • La conversazione include anche discussioni su Firefox Relay e su fornitori alternativi per la protezione della privacy.
  • I regolamenti dell'UE pongono delle sfide per l'offerta di alcuni servizi.
  • Vengono inoltre discussi i prezzi, l'efficacia della rimozione dei dati e le preoccupazioni relative alla privacy e alla sicurezza dei dati.
  • Alcuni utenti esprimono sfiducia in Mozilla e criticano le decisioni di gestione dell'azienda.
  • Ci sono anche critiche sulla possibilità di far pagare le persone per rimuovere le loro informazioni personali.
  • La discussione generale copre un'ampia gamma di argomenti relativi alla protezione della privacy e alla rimozione dei dati dagli intermediari.

Go 1.22: nuove funzionalità, ottimizzazioni e aggiornamenti della piattaforma

  • Go 1.22 è l'ultima versione del linguaggio di programmazione Go, che apporta miglioramenti e modifiche a vari aspetti come la toolchain, il runtime e le librerie.
  • Gli aggiornamenti includono miglioramenti all'interfaccia web dello strumento di tracciamento, avvisi migliorati nello strumento veterinario, ottimizzazione della garbage collection e riduzione dell'overhead di memoria.
  • Il rilascio introduce nuovi pacchetti, aggiornamenti ai pacchetti esistenti e modifiche a pacchetti come encoding/json, go/ast e database/sql. Sono inclusi anche aggiornamenti specifici per le piattaforme, come gli eseguibili indipendenti dalla posizione su macOS e il supporto per loong64 port e OpenBSD su PowerPC big-endian a 64 bit.

Reazioni

  • La conversazione ruota attorno a linguaggi di programmazione come Typescript, Go e Dart, discutendone i vantaggi, le sfide e gli standard di codifica.
  • Gli aggiornamenti e i cambiamenti in Go, come l'aggiunta della funzione "sql.Null[T]" e i miglioramenti nella libreria standard, sono discussi e apprezzati dalla comunità.
  • I partecipanti condividono le loro esperienze e opinioni sulla progettazione delle lingue e sull'aggiornamento alle nuove versioni, aggiungendo preziose intuizioni alla conversazione.

Danni milionari: gli spazzolini intelligenti infettati da 3M effettuano un attacco DDoS svizzero

  • Gli hacker hanno infettato circa tre milioni di spazzolini intelligenti in Svizzera e li hanno utilizzati per lanciare un attacco DDoS al sito web di un'azienda.
  • L'azienda ha subito danni per milioni di euro a seguito dell'attacco.
  • Gli spazzolini erano vulnerabili alla violazione a causa del loro sistema operativo basato su Java.
  • Gli esperti di sicurezza informatica consigliano ai proprietari dei dispositivi di aggiornarli, di monitorare eventuali attività sospette e di utilizzare software di sicurezza per proteggersi da attacchi simili.

Reazioni

  • La discussione esplora i rischi e le preoccupazioni per la sicurezza degli spazzolini da denti e dei dispositivi intelligenti connessi a Internet.
  • I partecipanti mettono in dubbio la validità di un articolo che suggerisce che gli spazzolini intelligenti sono stati utilizzati in attacchi DDoS.
  • Vengono sollevate diverse preoccupazioni, tra cui la sicurezza dei dispositivi, la privacy dei dati, la potenziale sorveglianza e l'importanza di migliori misure di sicurezza per i dispositivi intelligenti.

Privilegiare l'importanza dei server: La necessità di un monitoraggio regolare

  • Nella sala macchine principale dell'autore si è verificato un grave guasto all'aria condizionata, che ha costretto a spegnere le macchine.
  • L'incidente ha evidenziato la necessità di tenere traccia di quali macchine sono critiche e quali no, per poter pianificare meglio le future limitazioni di raffreddamento o di potenza.
  • Sebbene l'autore abbia riconosciuto l'importanza di documentare queste informazioni, ha detto che potrebbero non essere prioritarie a causa dei lavori di manutenzione in corso.

Reazioni

  • Il brano e il thread di commenti trattano argomenti quali la gestione dei server, i data center e l'infrastruttura IT.
  • Tra i temi principali, l'importanza della gestione degli asset e delle classificazioni di criticità e il trattamento dei server come bestiame, non come animali domestici.
  • La discussione approfondisce le sfide nell'implementazione di questo approccio, l'uso di servizi cloud, la necessità di ridondanza e resilienza del sistema server, nonché le limitazioni, i costi, i vincoli di bilancio nel mondo accademico e l'importanza della documentazione e dell'organizzazione.