Το Pikimov είναι ένας νέος διαδικτυακός σχεδιαστής κίνησης και επεξεργαστής βίντεο, εμπνευσμένος από το Photopea, και λειτουργεί ως δωρεάν εναλλακτική λύση στο After Effects.
Δεν απαιτεί εγγραφή, διατηρεί τα αρχεία στον υπολογιστή του χρήστ η και διασφαλίζει ότι τα έργα δεν χρησιμοποιούνται για εκπαίδευση AI.
Ο δημιουργός έχει ιστορικό ανάπτυξης λογισμικού VJ για πλατφόρμες όπως το Game Boy Advance, το Playstation 2 και το Raspberry Pi.
Το Pikimov είναι ένας νέος, δωρεάν, διαδικτυακός σχεδιαστής κίνησης και επεξεργαστής βίντεο που δημιουργήθηκε ως εναλλακτική λύση στο Adobe After Effects, χωρίς να απαιτείται εγγραφή ή μεταφορτώσεις στο cloud.
Το εργαλείο έχει λάβει θετικά σχόλια για την πιθανότητά του να αμφισβητήσει την κυριαρχία της Adobe, με τους χρήστες να προτείνουν βελτιώσεις στα όρια του ρυθμού καρέ, την αναφορά σφαλμάτων και τη διαχείριση των βασικών καρέ.
Προς το παρόν, το Pikimov υποστηρίζει μόνο το Chrome και το Edge λόγω συγκεκριμένων web APIs, με μελλοντικά σχέδια να προσθέσει λειτουργίες κοινότητας και πιθανώς να εμπορευματοποιήσει την εφαρμογή.
Μια κρίσιμη ευπάθεια (CVE-2024-6387) στον διακομιστή του OpenSSH σε συστήματα Linux που βασίζονται στο glibc επιτρέπει την απομακρυσμένη εκτέλεση κώδικα (RCE) λόγω μιας συνθήκης αγώνα στον διαχειριστή σημάτων.
Το ζήτημα, μια επανεμφάνιση του CVE-2006-5051, επηρεάζει τις εκδόσεις OpenSSH 3.4p1, 4.2p1 και 9.2p1, και περιλαμβάνει την εκμετάλλευση του χειριστή SIGALRM για να προκαλέσει διαφθορά της μνήμης heap και να εκτελέσει αυθαίρετο κώδικα.
Η μετρίαση περιλαμβάνει την εφαρμογή επιδιορθώσεων που μετακινούν τον ασύγχρονα-σήμα-μη-ασφαλή κώδικα έξω από τον χειριστή SIGALRM ή τον ορισμό του LoginGraceTime σε 0, αν και το τελευταίο μπορεί να προκαλέσει άρνηση υπηρεσίας.
Μια ευπάθεια Απομακρυσμένης Εκτέλεσης Κώδικα (RCE) ανακαλύφθηκε στον διακομιστή του OpenSSH σε συστήματα Linux που βασίζονται στο glibc, επιτρέποντας ενδεχομένως στους επιτιθέμενους να αποκτήσουν απομακρυσμένη πρόσβαση root.
Η διόρθωση για αυτήν την ευπάθεια υλοποιήθηκε μετακινώντας τον μη ασφαλή κώδικα από τον χειριστή σημάτων στη διαδικασία ακρόασης, καθιστώντας δύσκολη την αναδρομική εφαρμογή.
Το ζήτημα επηρεάζει κυρίως τα συστήματα 32-bit, με την εκμετάλλευση σε συστήματα 64-bit να θεωρείται δυνατή αλλά να μην έχει ακόμη αποδειχθεί· διάφορες διανομές έχουν ήδη κυκλοφορήσει ενημερώσεις.
Το Pipes είναι ένας οπτικός επεξεργαστής προγραμματισμού για ροές, επιτρέποντας στους χρήστες να ανακτούν, να δημιουργούν και να χειρίζονται ροές χρησιμοποιώντας μπλοκ, παρόμοια με το Yahoo! Pipes.
Υποστηρίζει διάφορες μορφές εισόδου, συμπεριλαμβανομένων των RSS, Atom, JSON, HTML και αρχείων κειμένου, και προσφέρει μια σειρά από μπλοκ για διαφορετικές λειτουργίες ροής όπως φιλτράρισμα, συγχώνευση και εξαγωγή περιεχομένου.
Το Pipes CE είναι ένα δωρεάν και ανοιχτού κώδικα λογισμικό (FOSS) υπό την άδεια AGPL, διαθέσιμο στο Github, και υποστηρίζει ενσωματώσεις με δημοφιλείς ιστότοπους όπως το Twitter, το YouTube και το Vimeo.
Το Pipes, ένα έργο εμπνευσμένο από το Yahoo Pipes, πρόσφατα υποβλήθηκε σε ενημερώσεις για τη βελτίωση της σταθερότητας, συμπεριλαμβανομένης της μετάβασης από κείμενο σε αντικείμε να RSS για τη μεταφορά δεδομένων μεταξύ των μπλοκ.
Αναβαθμίσεις διακομιστή και αναδιαμόρφωση των νημάτων και των εργατών puma εφαρμόστηκαν για την αντιμετώπιση προβλημάτων και σημείων συμφόρησης.
Μια πρόταση χρήστη για την προσθήκη ενός μπλοκ για περιλήψεις ή εικόνες που δημιουργούνται από AI μέσω αιτημάτων POST εξετάζεται, με ορισμένα θεμελιώδη μπλοκ να είναι ήδη σε θέση.
Η ανάρτηση συζητά τις μετρικές αξιολόγησης για την εκτίμηση της απόδοσης των προσαρμοσμένων γλωσσικών μοντέλων (LLMs) στην εξαγωγή δομημένων δεδομένων από δελτία τύπου, με έμφαση στην ακρίβεια.
Τα προσαρμοσμένα μοντέλα, συμπεριλαμβανομένων των TinyLlama, Mistral και Solar LLM, γενικά υπερείχαν σε ακρίβεια σε σχέση με τα GPT-4 και GPT-4 Turbo της OpenAI, παρά την πολυπλοκότητα και τον αργό ρυθμό των αξιολογήσεων.
Οι αξιολογήσεις υπογράμμισαν την ανάγκη για ένα καλύτερο σύστημα διαχείρισης της πολυπλοκότητας και της συντήρησης, με τα μελλοντικά βήματα να περιλαμβάνουν δοκιμές που δεν σχετίζονται με την ακρίβεια και την εξερεύνηση της εξυπηρέτησης μοντέλων.
Τα προσαρμοσμένα μοντέλα μπορούν να υπερέχουν των γενικών μοντέλων όπως το GPT-4 της OpenAI σε συγκεκριμένες εργασίες, όπως η εξαγωγή δεδομένων, η δημιουργική περίληψη, η απάντηση σε ερωτήσεις και η ταξινόμηση.
Η επιτυχία των προσαρμοσμένων μοντέλων εξαρτάται από δεδομένα εκπαίδευσης υψηλής ποιότητας, καθιστώντας τα αποτελεσματικά για εξειδικευμένη εξαγωγή πληροφοριών και προσιτά στους λάτρεις της τεχνολογίας.
Η λεπτομερής ρύθμιση μικρότερων μοντέλων, όπως το Llama 3 8B, μπορεί να είναι πιο αποδοτική και οικονομικά συμφέρουσα, αλλά η χρήση των απαντήσεων του μοντέλου για την εκπαίδευση νέων μοντέλων μπορεί να παραβιάζει τους όρους υπηρεσίας των μεγάλων παρόχων LLM.
Το Γιοχάνεσμπουργκ, κάποτε άγονο, μεταμορφώθηκε στην "πιο πράσινη πόλη στον κόσμο" μετά τη φύτευση εκατομμυρίων δέντρων για την καταπολέμηση της σκόνης από την εξόρυξη χρυσού.
Η δενδροφύτευση στο Γιοχάνεσμπουργκ ήταν άνισα κατανεμημένη λόγω του Απαρτχάιντ, αναδεικνύοντας τις κοινωνικοοικονομικές ανισότητες.
Τα αστικά δέντρα παρέχουν σημαντικά οφέλη, όπως η μείωση του φαινομένου της "θερμικής νησίδας", η λειτουργία ως ηχοφράγματα, η βελτίωση της αισθητικής, η αύξηση της βιοποικιλότητας και η ενθάρρυνση των υπαίθριων δραστηριοτήτων.
Οι πόλεις φυτεύουν όλο και περισσότερα δέντρα και προωθούν πράσινες στέγες για να αντιμετωπίσουν το θερμικό στρες και να βελτιώσουν την αστική βιωσιμότητα.
Η Ουτρέχτη, Ολλανδία, και η Ζυρίχη, Ελβετία, είναι κορυφαία παραδείγματα, ενώ πόλεις των ΗΠΑ όπως το Πόρτλαντ, Όρεγκον, έχουν πράσινες εντολές, και το Σολτ Λέικ Σίτι εξερευνά την ξηροκαλλιέργεια.
Τα δέντρα προσφέρουν σημαντικά οφέλη, όπως την ψύξη των αστικών περιοχών, τη βελτίωση της ποιότητας του αέρα και την ενίσχυση της συνολικής βιωσιμότητας, παρά τις προκλήσεις όπως η ανάπτυξη ιδιωτικών ακινήτων που οδηγεί στην απομάκρυνση των δέντρων.
Το Ladybird είναι ένας ανεξάρτητος περιηγητής ιστού που αναπτύσσεται από έναν μη κερδοσκοπικό οργανισμό, με έμφαση στην απόδοση, τη σταθερότητα και την ασφάλεια, με μια Alpha έκδοση προγραμματισμένη για το 2026.
Αρχικά ένας προβολέας HTML για το SerenityOS, τώρα υποστηρίζει Linux, macOS και άλλα συστήματα τύπου Unix, και είναι κατασκευασμένος εξ ολοκλήρου από την αρχή χωρίς τη χρήση κώδικα από άλλους περιηγητές.
Το έργο χρηματοδοτείται από χορηγίες και δωρεές, χωρίς διαφημίσεις ή εμπορευματοποίηση χρηστών, και αναπτύσσεται αυτή τη στιγμή από μια ομάδα τεσσάρων μηχανικών πλήρους απασχόλησης.
Ο κωδικός postzegelcode είναι ένας κωδικός εννέα χαρακτήρων που χρησιμοποιείται στην Ολλανδία ως χειρόγραφη εναλλακτική λύση για τα γραμματόσημα, αγορασμένος διαδικτυακά από την PostNL.
Εισήχθη το 2013, ο κωδικός πρέπει να γράφεται στο ταχυδρομείο εντός πέντε ημερών και έχει 78,8 τρισεκατομμύρια δυνατούς συνδυασμούς, καθιστώντας τον ασφαλή από εικασίες.
Από τον Δεκέμβριο του 2020, 590.000 άνθρωποι χρησιμοποίησαν postzegelcodes, οι οποίες τώρα κοστίζουν το ίδιο με τα παραδοσιακά γραμματόσημα.
Η συζήτηση περιστρέφεται γύρω από τη χρήση ψηφιακών ταχυδρομικών κωδικών, γνωστών ως "postzegelcode," οι οποίοι μπορούν να γραφτούν σε φακέλους αντί για τη χρήση παραδοσιακών γραμματοσήμων.
Διάφορες χώρες, συμπεριλαμβανομένων της Γερμανίας, της Δανίας, της Νορβηγίας και της Σουηδίας, έχουν εφαρμόσει παρόμοια συστήματα, επιτρέποντας στους χρήστες να αγοράζουν ταχυδρομικά τέλη διαδικτυακά και να γράφουν έναν κωδικό στην αλληλογραφία τους.
Το σύστημα επαινείται για την ευκολία του, ειδικά για εκείνους που δεν στέλνουν συχνά φυσική αλληλογραφία, καθώς εξαλείφει την ανάγκη για φυσικά γραμματόσημα και προσαρμόζεται στις μεταβαλλόμενες ταχυδρομικές τιμές.
Το Ανώτατο Δικαστήριο επέκτεινε την καθυστέρηση στην ποινική υπόθεση του Ντόναλντ Τραμπ σχετικά με τις εκλογές του 2020, μειώνοντας την πιθανότητα διεξαγωγής δίκης πριν από τις εκλογές του Νοεμβρίου.
Με απόφαση 6-3, η συντηρητική πλειοψηφία του δικαστηρίου χορήγησε στους πρώην προέδρους ευρεία ασυλία από δίωξη για επίσημες πράξεις, περιπλέκοντας την υπόθεση της εισαγγελίας και απαιτώντας περαιτέρω ανάλυση στο επίπεδο του πρωτοβάθμιου δικαστηρίου.
Η απόφαση υπογραμμίζει τη σημαντική επιρροή του δικαστηρίου στις επερχόμενες εκλογές, με τον Αρχιδικαστή Τζον Ρόμπερτς να τονίζει την ασυλία για επίσημες πράξεις και τη Δικαστή Σόνια Σοτομαγιόρ να διαφωνεί, υποστηρίζοντας ότι υπονομεύει την αρχή ότι κανείς δεν είναι υπεράνω του νόμου.
Το Ανώτατο Δικαστήριο έχει αποφανθεί ότι οι πρώην πρόεδροι έχουν ασυλία για επίσημες πράξεις, προκαλώντας συζήτηση σχετικά με τις πιθανές καταχρήσεις εξουσίας έναντι της ανάγκης για προστασία των προέδρων.
Η απόφαση ορίζει ότι η ασυλία ισχύει για ενέργειες εντός συνταγματικής εξουσίας αλλά όχι για ανεπίσημες πράξεις, εγείροντας ανησυχίες σχετικά με την ευθύνη για σοβαρά εγκλήματα.
Οι επικριτές, συμπεριλαμβανομένης της Δικαστού Σοτομαγιόρ, ανησυχούν ότι αυτή η απόφαση θα μπορούσε να επηρεάσει τις τρέχουσες και μελλοντικές νομικές υποθέσεις που αφορούν πρώην προέδρους.
Ο παραδοσιακός πολλαπλασιασμός πολυωνύμων έχει πολυπλοκότητα (O(n^2)), καθιστώντας τον αναποτελεσματικό για μεγάλα πολυώνυμα.
Ο Γρήγορος Μετασχηματισμός Fourier (FFT) μειώνει την πολυπλοκότητα του πολλαπλασιασμού πολυωνύμων σε (O(n \log n)) μετατρέποντας το πρόβλημα στον τομέα της συχνότητας.
Η μέθοδος που βασίζεται στο FFT περιλαμβάνει τη μετατροπή των πολυωνύμων στον τομέα της συχνότητας, τον πολλαπλασιασμό τους και τη μετατροπή του αποτελέσματος πίσω, βελτιώνοντας σημαντικά την αποδοτικότητα για πολυώνυμα υψηλού βαθμού.
Η συζήτηση επικεντρώνεται στη χρήση του Γρήγορου Μετασχηματισμού Fourier (FFT) για τον πολλαπλασιασμό πολυωνύμων, υπογραμμίζοντας την αποδοτικότητά του σε σύγκριση με τις αφελείς μεθόδους.
Βασικές γνώσεις περιλαμβάνουν τη σημασία της αριθμητικής ακρίβειας στους υπολογισμούς FFT και το ιστορικό πλαίσιο της ανάπτυξης του FFT για τον πολλαπλασιασμό πολυωνύμων.
Η συζήτηση αγγίζει επίσης πρακτικές εφαρμογές, όπως η διόρθωση σφαλμάτων, η επεξεργασία σήματος και η κρυπτογραφία μηδενικής γνώσης, όπου οι μέθοδοι που βασίζονται στο FFT είναι ιδιαίτερα ωφέλιμες.
Η ανάρτηση συζητά την ενσωμάτωση προγραμμάτων σε επαναλαμβανόμενα νευρωνικά δίκτυα (RNNs) και πώς τα εκπαιδευμένα RNNs μπορούν να υπερέχουν σε σχέση με τους χειρόγραφους αλγόριθμους.
Παρέχει ένα λεπτομερές παράδειγμα ανίχνευσης κώδικα προγράμματος σε μηνύματα, συγκρίνοντας απλούς κανόνες απόφασης, έναν χειρόγραφο αλγόριθμο και μια προσέγγιση βασισμένη σε RNN.
Η ανάρτηση αναδεικνύει τα πλεονεκτήματα των RNNs, όπως η κωδικοποίηση μηχανών κατάστασης, η χρήση εκπαιδεύσιμων συναρτήσεων ενεργοποίησης και η διαχείριση σύνθετων εργασιών με πειθαρχία που βασίζεται στα δεδομένα.
Το άρθρο συζητά την κατασκευή ενός νευρωνικού δικτύου χρησιμοποιώντας Python, αλλά λείπουν λεπτομέρειες σχετικά με τη δοκιμή και την απόκτηση δεδομένων εκπαίδευσης, τα οποία είναι κρίσιμα για να διασφαλιστεί η γενίκευση του μοντέλου σε αόρατες εισόδους.
Η συζήτηση αναδεικνύει το Θεώρημα Καθολικής Προσέγγισης, το οποίο δηλώνει ότι τα νευρωνικά δίκτυα μπορούν να αναπαραστήσουν οποιαδήποτε συνάρτηση με επιθυμητό επίπεδο ακρίβειας, αλλά τονίζει ότι η εκμάθηση αυτών των προσεγγίσεων δεν είναι εγγυημένη.
Υπάρχει μια συζήτηση για το αν τα Επαναλαμβανόμενα Νευρωνικά Δίκτυα (RNNs) αντικαθίστανται από τους μετασχηματιστές, με ορισμένους να υποστηρίζουν ότι τα RNNs εξακολουθούν να έχουν μοναδικά πλεονεκτήματα, όπως η σταθερή χρήση μνήμης, την οποία οι μετασχηματιστές δεν διαθέτουν.
Διάφορες εταιρείες προσλαμβάνουν για πολλαπλούς ρόλους, συμπεριλαμβανομένων απομακρυσμένων, επιτόπιων και υβριδικών θέσεων, σε διάφορες τοποθεσίες και βιομηχανίες.
Σημαντικές εταιρείες περιλαμβάνουν την Apple, Figma, Charge Robotics και SmileID, προσφέροντας θέσεις όπως Senior Software Engineer, Senior/Staff Security Engineer και Senior Frontend Engineer.
Ευκαιρίες υπάρχουν σε όλο τον κόσμο, με ορισμένες εταιρείες να προσφέρουν χορηγία βίζας και ρόλους σε αναδυόμενες τεχνολογίες όπως η τεχνητή νοημοσύνη, η μηχανική μάθηση και η ανάπτυξη πλήρους στοίβας.
Οι προγραμματιστές πρέπει να διατηρούν ένα υγιές επίπεδο σκεπτικισμού, καθώς η συγγραφή και η επαλήθευση της ορθότητας του κώδικα είναι από τη φύση τους δύσκολες και συχνά αδύνατες.
Οι αφαιρέσεις, ενώ απλοποιούν πολύπλοκα συστήματα, μπορεί να αποτύχουν και να οδηγήσουν σε προβλήματα όπως η υποβάθμιση της απόδοσης ή η απροσδιόριστη συμπεριφορά, όπως επισημαίνεται από τον Νόμο των Διαρρέουσων Αφαιρέσεων του Joel Spolsky.
Για να μετριάσουν άγνωστα ζητήματα, οι προγραμματιστές πρέπει να επαληθεύουν τις πληροφορίες, να δοκιμάζουν τις πεποιθήσεις τους και να μετρούν τον αντίκτυπο των αλλαγών στον κώδικα, ενώ παράλληλα μαθαίνουν συνεχώς για νέες πλατφόρμες, γλώσσες, εργαλεία και τεχνολογίες.
Η συζήτηση επικεντρώνεται στη σημασία της επίσημης επαλήθευσης στον προγραμματισμ ό, τονίζοντας ότι οι προγραμματιστές δεν πρέπει να εμπιστεύονται κανέναν, συμπεριλαμβανομένων των ίδιων, χωρίς αποδείξεις.
Η τυπική επαλήθευση, αν και πολύπλοκη και δαπανηρή, παρέχει ισχυρότερες εγγυήσεις ορθότητας σε σύγκριση με τις δοκιμές μονάδας, οι οποίες καλύπτουν μόνο συγκεκριμένα παραδείγματα.
Η συζήτηση αναδεικνύει τις ανταλλαγές μεταξύ της αυστηρότητας της επίσημης επαλήθευσης και της πρακτικότητας των δοκιμών μονάδας, υποδεικνύοντας ότι η επιλογή εξαρτάται από τις απαιτήσεις και τους πόρους του έργου.
Η ενοποίηση στην Elixir επεκτείνει την αντιστοίχιση προτύπων επιτρέποντας μεταβλητές και στις δύο πλευρές μιας εξίσωσης, επιλύοντας συμβολικές εξισώσεις και παράγοντας αντιστοιχίσεις υποκατάστασης.
Σε αντίθεση με την αντιστοίχιση προτύπων, η ενοποίηση μπορεί να διαχειριστεί μερικώς γνωστές τιμές, καθιστώντας την ένα ισχυρό εργαλείο για τον προγραμματισμό λογικής στην Elixir.
Ο αλγόριθμος ενοποίησης περιλαμβάνει τη διέλευση όρων, τη δοκιμή ισοδυναμίας, τη διαχείριση μεταβλητών και την αναδρομική ενοποίηση στοιχείων λίστας, απλοποιώντας τις αναθέσεις μεταβλητών μέσω υποκατάστασης.
Το άρθρο συγκρίνει την αποδοτικότητα των αλγορίθμων ενοποίησης στην ανάλυση τύπων, εστιάζοντας στον αλγόριθμο W και στον αλγόριθμο J.
Ο Αλγόριθμος W, που χρησιμοποιείται στην επαγωγή τύπων Hindley-Milner, είναι λιγότερο αποδοτικός και πιο επιρρεπής σε σφάλματα λόγω της ανάγκης για σύνθεση υποκαταστάσεων.
Ο Αλγόριθμος J, ο οποίος χρησιμοποιεί μια δομή δεδομένων union-find για καταστροφική ενοποίηση, είναι απλούστερος και πιο αποδοτικός, με επιπλέον γνώσεις για την ενοποίηση στην αντιστοίχιση προτύπων και την μεταγλωττισμένη αντιστοίχιση προτύπων χρησιμοποιώντας δέντρα αποφάσεων.
Το Google Arts & Culture προσφέρει μια ευρεία γκάμα εικονικών περιηγήσεων και διαδραστικών εμπειριών, επιτρέποντας στους χρήστες να εξερευνήσουν την τέχνη, την ιστορία και τον πολιτισμό από όλο τον κόσμο.
Τα κυριότερα σημεία περιλαμβάνουν εικονικές περιηγήσεις σε διάσημα μουσεία, εμπειρίες επαυξημένης πραγματικότητας (AR) και διαδραστικά παιχνίδια που κάνουν τη μάθηση για την τέχνη και τον πολιτισμό ενδιαφέρουσα και προσιτή.
Ειδικά χαρακτηριστικά περιλαμβάνουν τη δυνατότητα να εξερευνήσετε τη βιβλιοθήκη του Βαν Γκογκ, να κάνετε μια 3D περιήγηση στους πίνακες του Βερμέερ και να συμμετάσχετε σε μια πρόκληση χορού K-Pop σε συνεργασία με το Μουσείο V&A.
Το Google Arts and Culture είναι ένα λιγότερο γνωστό αλλά σημαντικό έργο της Google, που προσφέρει επιμελημένο πολιτιστικό περιεχόμενο από όλο τον κόσμο.
Οι χρήστες εκτιμούν τις εικόνες υψηλής ανάλυσης και τα μοναδικά χαρακτηριστικά του, όπως η δυνατότητα να ζουμάρουν κοντά σε έργα τέχνης και να εξερευνούν διάφορα πολιτιστικά έργα.
Η πλατφόρμα είναι ενεργή από το 2011 και συνεχίζει να αποτελεί πολύτιμο πόρο για τους λάτρεις της τέχνης και του πολιτισμού, παρά τις ανησυχίες σχετικά με τη μακροβιότητα των έργων της Google.
Οι ερευνητές δημιούργ ησαν ένα ολοκληρωμένο αρχείο περιεχομένου ειδησεογραφικών πρακτορείων των Η.Π.Α. από το 1878 έως το 1977, χρησιμοποιώντας μια βαθιά μαθησιακή διαδικασία σε σαρώσεις εικόνων από τοπικές εφημερίδες.
Το σύνολο δεδομένων περιλαμβάνει 2,7 εκατομμύρια μοναδικά άρθρα δημόσιου τομέα, γεωαναφερμένα, με ετικέτες ανά θέμα και συνδεδεμένα με τη Wikipedia, παρέχοντας πολύτιμες πληροφορίες για την υπολογιστική γλωσσολογία, τις κοινωνικές επιστήμες και την έρευνα στις ψηφιακές ανθρωπιστικές επιστήμες.
Το έργο περιλάμβανε την απομαγνητοφώνηση 138 εκατομμυρίων δομημένων κειμένων άρθρων και τη χρήση ενός νευρωνικού μοντέλου διπλού κωδικοποιητή για την απομάκρυνση των διπλών άρθρων, διασφαλίζοντας ότι περιλαμβανόταν μόνο περιεχόμενο δημόσιου τομέα.
Μια ολοκληρωμένη βάση δεδομένων ιστορικών ειδήσεων μέχρι το 1978 έχει δημιουργηθεί, αντικατοπτρίζοντας τις αλλαγές στους νόμους περί πνευματικών δικαιωμάτ ων, και είναι διαθέσιμη στο GitHub, αν και προς το παρόν είναι κενή.
Οι χρήστες έχουν εντοπίσει σφάλματα OCR (Οπτική Αναγνώριση Χαρακτήρων) στα δεδομένα, υπογραμμίζοντας τις επίμονες προκλήσεις στην ψηφιοποίηση ιστορικών κειμένων.
Το έργο, παρά τα προβλήματά του, επαινείται για την επιστημονική του αξία, με ακατέργαστες σαρώσεις διαθέσιμες μέσω της ψηφιακής συλλογής της Βιβλιοθήκης του Κογκρέσου.