On this page
Pikimov เป็นโปรแกรมออกแบบการเคลื่อนไหวและตัดต่อวิดีโอแบบเว็บที่เพิ่งเปิดตัวใหม่ ได้รับแรงบันดาลใจจาก Photopea และเป็นทางเลือกฟรีสำหรับ After Effects
ไม่ต้องลงทะเบียน เก็บไฟล์ไว้ในเครื่องของผู้ใช้ และรับประกันว่าโครงการจะไม่ถูกนำไปใช้ในการฝึก AI
ผู้สร้างมีประวัติในการพัฒนาซอฟต์แวร์ VJ สำหรับแพลตฟอร์มต่างๆ เช่น Game Boy Advance, Playstation 2 และ Raspberry Pi
Pikimov เป็นโปรแกรมออกแบบการเคลื่อนไหวและตัดต่อวิดีโอแบบเว็บที่ใหม่และฟรี สร้างขึ้นเป็นทางเลือกแทน Adobe After Effects โดยไม่ต้องสมัครสมาชิกหรืออัปโหลดข้อมูลไปยังคลาวด์
เครื่องมือนี้ได้รับคำชมเชยในด้านศักยภาพที่จะท้าทายความเป็นผู้นำของ Adobe โดยผู้ใช้แนะนำให้ปรับปรุงในเรื่องของการจำกัดอัตราเฟรม การรายงานข้อบกพร่อง และการจัดการคีย์เฟรม
ปัจจุบัน Pikimov รองรับเฉพาะ Chrome และ Edge เนื่องจากใช้เว็บ API เฉพาะ โดยมีแผนในอนาคตที่จะเพิ่มฟีเจอร์ชุมชนและอาจทำการสร้างรายได้จากแอป
ช่องโหว่ร้ายแรง (CVE-2024-6387) ในเซิร์ฟเวอร์ OpenSSH บนระบบ Linux ที่ใช้ glibc ทำให้สามารถรันโค้ดจากระยะไกล (RCE) ได้เนื่องจากการแข่งกันของตัวจัดการสัญญาณ
ปัญหานี้ ซึ่งเป็นการถดถอยของ CVE-2006-5051 ส่งผลกระทบต่อ OpenSSH เวอร์ชัน 3.4p1, 4.2p1, และ 9.2p1 และเกี่ยวข้องกับการใช้ประโยชน์จากตัวจัดการ SIGALRM เพื่อทำให้เกิดการคอร์รัปชันของ heap และรันโค้ดตามอำเภอใจ
การบรรเทาผลกระทบรวมถึงการใช้แพตช์ที่ย้ายโค้ดที่ไม่ปลอดภัยต่อสัญญาณแบบอะซิงโครนัสออกจากตัวจัดการ SIGALRM หรือการตั้งค่า LoginGraceTime
เป็น 0 แม้ว่าวิธีหลังอาจทำให้เกิดการปฏิเสธการให้บริการได้
มีการค้นพบช่องโหว่การรันโค้ดระยะไกล (RCE) ในเซิร์ฟเวอร์ OpenSSH บนระบบ Linux ที่ใช้ glibc ซึ่งอาจทำให้ผู้โจมตีสามารถเข้าถึงสิทธิ์ root จากระยะไกลได้
การแก้ไขช่องโหว่นี้ได้ดำเนินการโดยการย้ายโค้ดที่ไม่ปลอดภัยจากตัวจัดการสัญญาณไปยังกระบวนการผู้ฟัง ทำให้ยากต่อการย้อนกลับ
ปัญหานี้ส่งผลกระทบต่อระบบ 32 บิตเป็นหลัก โดยการโจมตีในระบบ 64 บิตเชื่อว่าเป็นไปได้แต่ยังไม่ได้รับการแสดงให้เห็น; การแจกจ่ายต่างๆ ได้ปล่อยแพตช์ออกมาแล้ว
Pipe เป็นโปรแกรมแก้ไขการเขียนโปรแกรมเชิงภาพสำหรับฟีด ช่วยให้ผู้ใช้สามารถดึง สร้าง และจัดการฟีดโดยใช้บล็อก ซึ่งคล้ายกับ Yahoo! Pipes
มันรองรับรูปแบบอินพุตต่างๆ รวมถึง RSS, Atom, JSON, HTML และไฟล์ข้อความ และมีบล็อกหลากหลายสำหรับการดำเนินการฟีดต่างๆ เช่น การกรอง การรวม และการดึงเนื้อหา
โปรแกรม Pipes CE เป็นซอฟต์แวร์ฟรีและโอเพ่นซอร์ส (FOSS) ภายใต้ใบอนุญาต AGPL ที่สามารถหาได้บน Github และรองรับการเชื่อมต่อกับเว็บไซต์ยอดนิยมอย่าง Twitter, YouTube และ Vimeo
ท่อ, โครงการที่ได้รับแรงบันดาลใจจาก Yahoo Pipes, เพิ่งได้รับการอัปเดตเพื่อปรับปรุงความเสถียร รวมถึงการเปลี่ยนจากข้อความเป็นวัตถุ RSS สำหรับการขนส่งข้อมูลระหว่างบล็อก
การอัปเกรดเซิร์ฟเวอร์และการกำหนดค่าใหม่ของเธรดและพนักงานพูมาถูกนำมาใช้เพื่อแก้ไขปัญหาและคอขวด
มีการพิจารณาข้อเสนอของผู้ใช้ในการเพิ่มบล็อกสำหรับสรุปหรือภาพที่สร้างโดย AI ผ่านคำขอ POST โดยมีบล็อกพื้นฐานบางส่วนที่ได้จัดเตรียมไว้แล้ว
โพสต์นี้กล่าวถึงเมตริกการประเมินสำหรับการประเมินประสิทธิภาพของโมเดลภาษาที่ปรับแต่งแล้ว (LLMs) ในการดึงข้อมูลที่มีโครงสร้างจากข่าวประชาสัมพันธ์ โดยเน้นที่ความแม่นยำ
โมเดลที่ปรับแต่งแล้ว รวมถึง TinyLlama, Mistral, และ Solar LLM โดยทั่วไปมีประสิทธิภาพดีกว่า GPT-4 และ GPT-4 Turbo ของ OpenAI ในด้านความแม่นยำ แม้ว่าการประเมินจะมีความซับซ้อนและช้า
การประเมินได้เน้นย้ำถึงความจำเป็นในการมีระบบที่ดีกว่าในการจัดการกับความซับซ้อนและการบำรุงรักษา โดยขั้นตอนในอนาคตจะรวมถึงการทดสอบที่ไม่เกี่ยวข้องกับความแม่นยำและการสำรวจการให้บริการโมเดล
โมเดลที่ปรับแต่งอย่างละเอียดสามารถทำงานได้ดีกว่าโมเดลทั่วไปอย่าง GPT-4 ของ OpenAI ในงานเฉพาะ เช่น การสกัดข้อมูล การสรุปเชิงสร้างสรรค์ การตอบคำถาม และการจัดประเภท
ความสำเร็จของโมเดลที่ปรับแต่งอย่างละเอียดขึ้นอยู่กับข้อมูลการฝึกอบรมที่มีคุณภาพสูง ทำให้พวกมันมีประสิทธิภาพสำหรับการสกัดข้อมูลเฉพาะทางและเข้าถึงได้สำหรับผู้ที่สนใจเทคโนโลยี
การปรับแต่งโมเดลขนาดเล็ก เช่น Llama 3 8B อาจมีประสิทธิภาพและคุ้มค่ามากกว่า แต่การใช้การตอบสนองของโมเดลเพื่อฝึกอบรมโมเดลใหม่อาจละเมิดข้อกำหนดการให้บริการของผู้ให้บริการ LLM รายใหญ่
โจฮันเนสเบิร์ก ซึ่งเคยแห้งแล้ง ได้เปลี่ยนแปลงเป็น "เมืองที่เขียวที่สุดในโลก" หลังจากปลูกต้นไม้หลายล้านต้นเพื่อแก้ปัญหาฝุ่นจากการสกัดทองคำ
การปลูกต้นไม้ในโจฮันเนสเบิร์กมีการกระจายตัวที่ไม่สม่ำเสมอเนื่องจากการแบ่งแยกสีผิว ซึ่งเน้นให้เห็นถึงความไม่เท่าเทียมทางเศรษฐกิจและสังคม
ต้นไม้ในเมืองให้ประโยชน์อย่างมากมาย รวมถึงการลดปรากฏการณ์ "เกาะความร้อน" ทำหน้าที่เป็นกำแพงเสียง เพิ่มความสวยงาม เพิ่มความหลากหลายทางชีวภาพ และส่งเสริมกิจกรรมกลางแจ้ง
เมืองต่างๆ กำลังปลูกต้นไม้และส่งเสริมหลังคาเขียวมากขึ้นเพื่อรับมือกับความเครียดจากความร้อนและปรับปรุงความน่าอยู่ในเมือง
อูเทรคต์ ประเทศเนเธอร์แลนด์ และซูริก ประเทศสวิตเซอร์แลนด์ เป็นตัวอย่างที่โดดเด่น ขณะที่เมืองในสหรัฐอเมริกาอย่างพอร์ตแลนด์ รัฐออริกอน มีข้อบังคับด้านสิ่งแวดล้อม และซอลต์เลกซิตีกำลังสำรวจการจัดสวนแบบแห้ง
ต้นไม้มีประโยชน์อย่างมาก เช่น การทำให้พื้นที่ในเมืองเย็นลง ปรับปรุงคุณภาพอากาศ และเพิ่มความน่าอยู่โดยรวม แม้ว่าจะมีความท้าทายเช่น การพัฒนาอสังหาริมทรัพย์ส่วนตัวที่นำไปสู่การตัดต้นไม้ก็ตาม
Ladybird เป็นเว็บเบราว์เซอร์อิสระที่พัฒนาโดยองค์กรไม่แสวงหาผลกำไร โดยเน้นที่ประสิทธิภาพ ความเสถียร และความปลอดภัย โดยมีแผนจะปล่อยเวอร์ชัน Alpha ในปี 2026
เริ่มแรกเป็นโปรแกรมดู HTML สำหรับ SerenityOS ตอนนี้รองรับ Linux, macOS และระบบ Unix-like อื่น ๆ และถูกสร้างขึ้นใหม่ทั้งหมดโดยไม่ใช้โค้ดจากเบราว์เซอร์อื่น
โครงการนี้ได้รับการสนับสนุนจากการเป็นสปอนเซอร์และการบริจาค โดยไม่มีโฆษณาหรือการสร้างรายได้จากผู้ใช้ และปัจจุบันพัฒนาโดยทีมวิศวกรเต็มเวลา 4 คน
Ladybird ซึ่งเริ่มต้นเป็นตัวแสดงผล HTML สำหรับ SerenityOS กำลังพัฒนาเป็นโครงการเบราว์เซอร์ข้ามแพลตฟอร์ม
โครงการได้รับเงินบริจาคจำนวน 1,000,000 ดอลลาร์จาก Chris Wanstrath ผู้ร่วมก่อตั้ง GitHub ซึ่งแสดงถึงการสนับสนุนทางการเงินที่แข็งแกร่ง
ทีมงานวางแผนที่จะปล่อยเวอร์ชันอัลฟาภายในปี 2026 โดยเน้นความเป็นโมดูลและการปฏิบัติตามมาตรฐานเว็บสมัยใหม่
Postzegelcode คือรหัสเก้าตัวอักษรที่ใช้ในประเทศเนเธอร์แลนด์เป็นทางเลือกในการเขียนด้วยมือแทนแสตมป์ไปรษณีย์ ซึ่งสามารถซื้อออนไลน์จาก PostNL ได้
เปิดตัวในปี 2013 รหัสนี้ต้องเขียนบนจดหมายภายในห้าวันและมีความเป็นไปได้ในการผสมผสานถึง 78.8 ล้านล้านแบบ ทำให้มันปลอดภัยจากการเดา
ณ เดือนธันวาคม 2020 มีผู้ใช้รหัสไปรษณีย์จำนวน 590,000 คน ซึ่งปัจจุบันมีค่าใช้จ่ายเท่ากับแสตมป์แบบดั้งเดิม
การสนทนานี้เกี่ยวกับการใช้รหัสไปรษณีย์ดิจิทัลที่เรียกว่า "postzegelcode" ซึ่งสามารถเขียนบนซองจดหมายแทนการใช้แสตมป์แบบดั้งเดิม
หลายประเทศ รวมถึงเยอรมนี เดนมาร์ก นอร์เวย์ และสวีเดน ได้ดำเนินการระบบที่คล้ายกัน โดยอนุญาตให้ผู้ใช้ซื้อไปรษณีย์ออนไลน์และเขียนรหัสบนจดหมายของพวกเขา
ระบบนี้ได้รับการยกย่องในเรื่องความสะดวกสบาย โดยเฉพาะสำหรับผู้ที่ไม่ส่งจดหมายทางกายภาพบ่อย ๆ เนื่องจากไม่ต้องใช้แสตมป์ทางกายภาพและสามารถปรับตัวตามอัตราค่าบริการไปรษณีย์ที่เปลี่ยนแปลงได้
ศาลสูงสุดได้ขยายเวลาการพิจารณาคดีอาญาของโดนัลด์ ทรัมป์ที่เกี่ยวข้องกับการเลือกตั้งปี 2020 ทำให้ความเป็นไปได้ที่จะมีการพิจารณาคดีก่อนการเลือกตั้งในเดือนพฤศจิกายนลดลง
ในการตัดสิน 6-3 ศาลที่มีเสียงข้างมากเป็นฝ่ายอนุรักษ์นิยมได้ให้ความคุ้มครองอดีตประธานาธิบดีจากการถูกดำเนินคดีในกรณีการกระทำทางการเมืองอย่างกว้างขวาง ทำให้การดำเนินคดีมีความซับซ้อนมากขึ้นและต้องการการวิเคราะห์เพิ่มเติมในระดับศาลพิจารณาคดี
การตัดสินใจนี้เน้นย้ำถึงอิทธิพลสำคัญของศาลต่อการเลือกตั้งที่กำลังจะมาถึง โดยหัวหน้าผู้พิพากษาจอห์น โรเบิร์ตส์เน้นย้ำถึงการมีภูมิคุ้มกันสำหรับการกระทำทางการ และผู้พิพากษาโซเนีย โซโตมาเยอร์ไม่เห็นด้วย โดยโต้แย้งว่ามันบ่อนทำลายหลักการที่ว่าไม่มีใครอยู่เหนือกฎหมาย
ศาลฎีกาได้ตัดสินว่าอดีตประธานาธิบดีมีความคุ้มกันสำหรับการกระทำในหน้าที่ราชการ ซึ่งก่อให้เกิดการถกเถียงเกี่ยวกับการใช้อำนาจในทางที่ผิดที่อาจเกิดขึ้นเมื่อเทียบกับความจำเป็นในการปกป้องประธานาธิบดี
คำตัดสินระบุว่าภูมิคุ้มกันใช้กับการกระทำภายในอำนาจตามรัฐธรรมนูญ แต่ไม่ใช้กับการกระทำที่ไม่เป็นทางการ ซึ่งทำให้เกิดความกังวลเกี่ยวกับความรับผิดชอบต่ออาชญากรรมร้ายแรง
นักวิจารณ์ รวมถึงผู้พิพากษาโซโตมาเยอร์ กังวลว่าการตัดสินใจนี้อาจส่งผลกระทบต่อคดีทางกฎหมายที่กำลังดำเนินอยู่และในอนาคตที่เกี่ยวข้องกับอดีตประธานาธิบดี
การคูณพหุนามแบบดั้งเดิมมีความซับซ้อน (O(n^2)) ทำให้ไม่มีประสิทธิภาพสำหรับพหุนามขนาดใหญ่
การแปลงฟูเรียร์แบบเร็ว (FFT) ลดความซับซ้อนของการคูณพหุนามลงเหลือ (O(n \log n)) โดยการแปลงปัญหาไปยังโดเมนความถี่
วิธีการที่ใช้ FFT เกี่ยวข้องกับการแปลงพหุนามไปยังโดเมนความถี่, การคูณพหุนามเหล่านั้น, และการแปลงผลลัพธ์กลับมา ซึ่งช่วยเพิ่มประสิทธิภาพอย่างมากสำหรับพหุนามที่มีดีกรีสูง
การอภิปรายมุ่งเน้นไปที่การใช้การแปลงฟูเรียร์อย่างรวดเร็ว (FFT) สำหรับการคูณพหุนาม โดยเน้นถึงประสิทธิภาพของมันเมื่อเทียบกับวิธีการแบบง่าย ๆ
ข้อมูลสำคัญรวมถึงความสำคัญของความแม่นยำทางตัวเลขในการคำนวณ FFT และบริบททางประวัติศาสตร์ของการพัฒนา FFT สำหรับการคูณพหุนาม
การสนทนายังครอบคลุมถึงการประยุกต์ใช้ในทางปฏิบัติ เช่น การแก้ไขข้อผิดพลาด การประมวลผลสัญญาณ และการเข้ารหัสแบบไม่ต้องเปิดเผยข้อมูล ซึ่งวิธีการที่ใช้ FFT นั้นมีประโยชน์อย่างยิ่ง
โพสต์นี้กล่าวถึงการฝังโปรแกรมในเครือข่ายประสาทเทียมแบบวนซ้ำ (RNNs) และวิธีที่ RNNs ที่ผ่านการฝึกสามารถทำงานได้ดีกว่าอัลกอริธึมที่เขียนด้วยมือ
มันให้ตัวอย่างที่ละเอียดในการตรวจจับโค้ดโปรแกรมในข้อความ โดยเปรียบเทียบกฎการตัดสินใจแบบง่าย อัลกอริธึมที่เขียนด้วยมือ และวิธีการที่ใช้ RNN
โพสต์นี้เน้นถึงข้อดีของ RNNs เช่น การเข้ารหัสเครื่องสถานะ การใช้ฟังก์ชันการกระตุ้นที่สามารถฝึกได้ และการจัดการงานที่ซับซ้อนด้วยวินัยที่ขับเคลื่อนด้วยข้อมูล
บทความนี้กล่าวถึงการสร้างเครือข่ายประสาทเทียมโดยใช้ Python แต่ขาดรายละเอียดเกี่ยวกับการทดสอบและการได้รับข้อมูลการฝึกอบรม ซึ่งเป็นสิ่งสำคัญสำหรับการรับประกันว่าโมเดลจะสามารถทั่วไปกับข้อมูลที่ไม่เคยเห็นมาก่อน
การอภิปรายเน้นย้ำถึงทฤษฎีการประมาณค่าทั่วไป ซึ่งระบุว่าเครือข่ายประสาทเทียมสามารถแทนฟังก์ชันใด ๆ ได้ในระดับความแม่นยำที่ต้องการ แต่เน้นว่าการเรียนรู้การประมาณค่าเหล่านี้ไม่ได้รับประกัน
มีการถกเถียงกันว่าเครือข่ายประสาทเทียมแบบวนซ้ำ (RNNs) กำลังถูกแทนที่ด้วยทรานส์ฟอร์เมอร์หรือไม่ โดยบางคนโต้แย้งว่า RNNs ยังคงมีข้อได้เปรียบที่ไม่เหมือนใคร เช่น การใช้หน่วยความจำคงที่ ซึ่งทรานส์ฟอร์เมอร์ไม่มี
บริษัทต่างๆ กำลังจ้างงานในหลายตำแหน่ง รวมถึงตำแหน่งที่ทำงานจากระยะไกล ทำงานในสถานที่ และทำงานแบบผสมผสาน ในหลากหลายสถานที่และอุตสาหกรรม
บริษัทที่น่าสนใจได้แก่ Apple, Figma, Charge Robotics, และ SmileID ซึ่งมีตำแหน่งงานเช่น วิศวกรซอฟต์แวร์อาวุโส, วิศวกรความปลอดภัยอาวุโส/เจ้าหน้าที่, และวิศวกรส่วนหน้าระดับอาวุโส
โอกาสมีอยู่ทั่วโลก โดยบางบริษัทเสนอการสนับสนุนวีซ่าและบทบาทในเทคโนโลยีที่กำลังเกิดขึ้นใหม่ เช่น ปัญญาประดิษฐ์ การเรียนรู้ของเครื่อง และการพัฒนาครบวงจร
โปรแกรมเมอร์ควรรักษาระดับความสงสัยในเชิงบวก เนื่องจากการเขียนและตรวจสอบความถูกต้องของโค้ดนั้นมีความท้าทายโดยธรรมชาติและมักจะเป็นไปไม่ได้
การย่อส่วนข้อมูล แม้ว่าจะช่วยให้ระบบที่ซับซ้อนง่ายขึ้น แต่ก็อาจล้มเหลวและนำไปสู่ปัญหาต่างๆ เช่น การลดประสิทธิภาพหรือพฤติกรรมที่ไม่สามารถคาดเดาได้ ดังที่กฎของการย่อส่วนข้อมูลที่รั่วไหลของ Joel Spolsky ได้เน้นย้ำไว้
เพื่อลดปัญหาที่ไม่ทราบสาเหตุ นักโปรแกรมเมอร์ควรตรวจสอบข้อมูล ทดสอบความเชื่อ และวัดผลกระทบของการเปลี่ยนแปลงโค้ด พร้อมกับเรียนรู้เกี่ยวกับแพลตฟอร์ม ภาษา เครื่องมือ และเทคโนโลยีใหม่ๆ อย่างต่อเนื่อง
การอภิปรายเน้นถึงความสำคัญของการตรวจสอบอย่างเป็นทางการในโปรแกรมมิ่ง โดยเน้นว่าผู้เขียนโปรแกรมไม่ควรไว้วางใจใคร รวมถึงตัวเองด้วย หากไม่มีหลักฐานยืนยัน
การตรวจสอบอย่างเป็นทางการ แม้ว่าจะซับซ้อนและมีค่าใช้จ่ายสูง แต่ให้การรับประกันความถูกต้องที่แข็งแกร่งกว่าการทดสอบหน่วย ซึ่งครอบคลุมเพียงตัวอย่างเฉพาะเท่านั้น
การอภิปรายเน้นถึงการแลกเปลี่ยนระหว่างความเข้มงวดของการตรวจสอบอย่างเป็นทางการและความเป็นจริงของการทดสอบหน่วย โดยแนะนำว่าการเลือกขึ้นอยู่กับความต้องการและทรัพยากรของโครงการ
การรวมใน Elixir ขยายการจับคู่รูปแบบโดยอนุญาตให้มีตัวแปรทั้งสองด้านของสมการ แก้สมการเชิงสัญลักษณ์และสร้างการแมปการแทนที่
ต่างจากการจับคู่รูปแบบ การรวมสามารถจัดการกับค่าที่รู้เพียงบางส่วนได้ ทำให้มันเป็นเครื่องมือที่ทรงพลังสำหรับการเขียนโปรแกรมเชิงตรรกะใน Elixir
อัลกอริทึมการรวมกันเกี่ยวข้องกับการเดินผ่านเทอม การทดสอบความเท่าเทียมกัน การจัดการตัวแปร และการรวมองค์ประกอบของรายการแบบเรียกซ้ำ โดยทำให้การกำหนดตัวแปรง่ายขึ้นผ่านการแทนที่
บทความนี้เปรียบเทียบประสิทธิภาพของอัลกอริธึมการรวมในการอนุมานประเภท โดยเน้นที่อัลกอริธึม W และอัลกอริธึม J
อัลกอริทึม W ที่ใช้ในการอนุมานประเภท Hindley-Milner มีประสิทธิภาพน้อยกว่าและมีแนวโน้มที่จะเกิดข้อผิดพลาดมากขึ้นเนื่องจากความจำเป็นในการประกอบการแทนที่
อัลกอริทึม J ซึ่งใช้โครงสร้างข้อมูล union-find สำหรับการรวมแบบทำลายล้าง มีความเรียบง่ายและมีประสิทธิภาพมากขึ้น พร้อมกับข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับการรวมใน pattern matching และการจับคู่รูปแบบที่คอมไพล์โดยใช้ decision trees
Google Arts & Culture นำเสนอทัวร์เสมือนจริงและประสบการณ์เชิงโต้ตอบที่หลากหลาย ช่วยให้ผู้ใช้สามารถสำรวจศิลปะ ประวัติศาสตร์ และวัฒนธรรมจากทั่วทุกมุมโลกได้
ไฮไลท์รวมถึงการทัวร์เสมือนจริงของพิพิธภัณฑ์ที่มีชื่อเสียง ประสบการณ์ความจริงเสริม (AR) และเกมแบบโต้ตอบที่ทำให้การเรียนรู้เกี่ยวกับศิลปะและวัฒนธรรมเป็นเรื่องที่น่าสนใจและเข้าถึงได้ง่าย
คุณสมบัติพิเศษรวมถึงความสามารถในการสำรวจห้องสมุดของแวนโก๊ะ, ทัวร์ 3 มิติของภาพวาดของเวอร์เมียร์, และเข้าร่วมการท้าทายการเต้น K-Pop ร่วมกับพิพิธภัณฑ์ V&A
Google Arts and Culture เป็นโครงการที่ไม่ค่อยมีคนรู้จักแต่มีความสำคัญของ Google ที่นำเสนอเนื้อหาทางวัฒนธรรมที่คัดสรรจากทั่วโลก
ผู้ใช้ชื่นชมภาพความละเอียดสูงและคุณสมบัติพิเศษ เช่น ความสามารถในการซูมเข้าใกล้ผลงานศิลปะและสำรวจโครงการวัฒนธรรมต่าง ๆ
แพลตฟอร์มนี้ได้เปิดใช้งานมาตั้งแต่ปี 2011 และยังคงเป็นแหล่งข้อมูลที่มีค่าสำหรับผู้ที่สนใจในศิลปะและวัฒนธรรม แม้ว่าจะมีความกังวลเกี่ยวกับความยั่งยืนของโครงการของ Google ก็ตาม
นักวิจัยได้สร้างคลังข้อมูลข่าวสารของสหรัฐอเมริกาที่ครอบคลุมตั้งแต่ปี 1878 ถึง 1977 โดยใช้กระบวนการเรียนรู้เชิงลึกบนภาพสแกนจากหนังสือพิมพ์ท้องถิ่น
ชุดข้อมูลนี้ประกอบด้วยบทความในโดเมนสาธารณะจำนวน 2.7 ล้านบทความที่ไม่ซ้ำกัน ซึ่งมีการระบุพิกัดทางภูมิศาสตร์ ติดแท็กตามหัวข้อ และเชื่อมโยงกับวิกิพีเดีย ซึ่งให้ข้อมูลที่มีค่าสำหรับการวิจัยด้านภาษาศาสตร์เชิงคำนวณ สังคมศาสตร์ และมนุษยศาสตร์ดิจิทัล
โครงการนี้เกี่ยวข้องกับการถอดความบทความที่มีโครงสร้างจำนวน 138 ล้านบทความ และใช้โมเดล neural bi-encoder เพื่อกำจัดบทความที่ซ้ำกัน โดยมั่นใจว่ามีเพียงเนื้อหาที่เป็นสาธารณสมบัติเท่านั้นที่ถูกรวมไว้
ฐานข้อมูลที่ครอบคลุมข่าวสารทางประวัติศาสตร์จนถึงปี 1978 ได้ถูกสร้างขึ้นแล้ว ซึ่งสะท้อนถึงการเปลี่ยนแปลงในกฎหมายลิขสิทธิ์ และมีให้ใช้งานบน GitHub แม้ว่าปัจจุบันจะยังว่างเปล่า
ผู้ใช้ได้ระบุข้อผิดพลาดของ OCR (การรู้จำอักขระด้วยแสง) ในข้อมูล ซึ่งเน้นย้ำถึงความท้าทายที่ยังคงมีอยู่ในการแปลงข้อความประวัติศาสตร์เป็นดิจิทัล
โครงการนี้ แม้จะมีปัญหา แต่ก็ได้รับการยกย่องในด้านคุณค่าทางวิชาการ โดยมีการสแกนดิบที่สามารถเข้าถึงได้ผ่านคอลเลกชันดิจิทัลของหอสมุดรัฐสภา