Skip to main content

2025-01-28

เรากำลังนำ Pebble กลับมา

ปฏิกิริยา

Pebble กำลังถูกฟื้นฟูด้วยการสนับสนุนจาก Google โดยมุ่งเน้นไปที่จุดแข็งดั้งเดิม เช่น ความสามารถในการปรับแต่งได้ง่าย อายุการใช้งานแบตเตอรี่ที่ยาวนาน และการทำหน้าที่เป็นส่วนขยายของโทรศัพท์ การฟื้นฟูนี้มีเป้าหมายเพื่อรักษาลักษณะโอเพ่นซอร์สของ Pebble และหลีกเลี่ยงการบังคับให้สมัครสมาชิกคลาวด์ ซึ่งเป็นที่น่าสนใจสำหรับแฮกเกอร์และผู้ที่ชื่นชอบเทคโนโลยี ชุมชนรู้สึกตื่นเต้นกับการกลับมาของ Pebble โดยสะท้อนถึงคุณสมบัติที่เป็นเอกลักษณ์และอิทธิพลต่อเทคโนโลยีสวมใส่ได้

Google เปิดซอร์ส Pebble OS

ปฏิกิริยา

Google ได้เปิดซอร์ส Pebble OS ซึ่งสร้างความตื่นเต้นให้กับแฟน ๆ และนักพัฒนาสำหรับการพัฒนาใหม่ ๆ ที่เป็นไปได้ในเทคโนโลยีสมาร์ทวอทช์ การเผยแพร่บน GitHub ไม่รวมถึงส่วนประกอบที่เป็นกรรมสิทธิ์ เช่น ฟอนต์ของระบบและสแต็ก Bluetooth ดังนั้นจึงไม่สามารถคอมไพล์ในรูปแบบปัจจุบันได้ การเคลื่อนไหวนี้ถูกมองว่าเป็นท่าทีเชิงบวกจาก Google ซึ่งเกิดจากความพยายามภายใน และถูกมองว่าเป็นก้าวหนึ่งในการฟื้นฟูระบบนิเวศของนาฬิกาอัจฉริยะ Pebble

รัน DeepSeek R1 Dynamic 1.58-บิต

ปฏิกิริยา

DeepSeek R1 Dynamic 1.58-bit สามารถลดขนาดได้ถึง 80% และทำงานที่ความเร็ว 140 โทเค็นต่อวินาทีโดยใช้ H100s คู่ แต่ความเร็วที่ช้าและปัญหาการซ้ำทำให้เกิดคำถามเกี่ยวกับความเป็นไปได้ในการใช้งานจริง การควอนไทเซชันแบบไดนามิกช่วยในด้านประสิทธิภาพ แต่ยังคงมีความกังวลเกี่ยวกับการเข้าถึง ค่าใช้จ่าย และข้อเรียกร้องเกี่ยวกับค่าใช้จ่ายในการฝึกอบรมของโมเดล ซึ่งนำไปสู่การตรวจสอบอย่างละเอียด โมเดลนี้มีผลกระทบที่น่าจดจำต่อตลาด โดยมีความพยายามในการทำซ้ำผลลัพธ์ของมัน แม้ว่าประสิทธิภาพของมันจะถูกถกเถียงเมื่อเทียบกับโมเดลที่ใหญ่กว่า

ผลลัพธ์ที่น่าพอใจจาก DeepSeek R1 สำหรับโค้ด

คำขอการดึง (PR) โดย Xuan-Son Nguyen สำหรับ llama.cpp ช่วยเพิ่มความเร็วของ WebAssembly (WASM) โดยใช้คำสั่ง Single Instruction, Multiple Data (SIMD) โดยมีการสนับสนุนที่สำคัญจาก DeekSeek-R1 PR นี้รวมถึง model_map แบบไดนามิกที่สร้างจากการตอบสนองของ API ซึ่งช่วยลดความจำเป็นในการใช้เวอร์ชันที่เขียนโค้ดไว้ล่วงหน้า แสดงให้เห็นถึงนวัตกรรมในการพัฒนาโปรแกรมเสริม บล็อกของ Simon Willison ยังครอบคลุมหัวข้อที่ทันสมัย เช่น โครงการโอเพนซอร์ส, Citations API ของ Anthropic, และโครงการโมเดลภาษาขนาดใหญ่ (LLM) ซึ่งบ่งบอกถึงการมุ่งเน้นในการสนทนาเกี่ยวกับเทคโนโลยีล้ำสมัย

ปฏิกิริยา

DeepSeek R1 แสดงให้เห็นถึงศักยภาพของ AI ในการเขียนโค้ดโดยการเขียน 99% ของคำขอรวม (PR) สำหรับ llama.cpp ซึ่งแสดงให้เห็นถึงบทบาทที่เพิ่มขึ้นของ AI ในการพัฒนาซอฟต์แวร์ เครื่องมืออย่าง aider ตอนนี้มีหน้าที่ในการสร้างโค้ดใหม่ถึง 70-82% ในการปล่อยซอฟต์แวร์ใหม่ ซึ่งบ่งบอกถึงการเพิ่มขึ้นอย่างมากในประสิทธิภาพการทำงานผ่านการช่วยเหลือของ AI แม้จะมีความก้าวหน้าเหล่านี้ แต่ AI ยังคงต้องการการดูแลจากมนุษย์สำหรับการแก้ปัญหาที่ซับซ้อนและการผสานรวมกับฐานรหัสที่มีอยู่ ซึ่งบ่งบอกถึงการเปลี่ยนแปลงในพลวัตของงานและความต้องการทักษะในอุตสาหกรรม

ภาพประกอบ DeepSeek-R1

DeepSeek-R1 เป็นโมเดล AI ที่เพิ่งเปิดตัวใหม่ โดยเน้นความสามารถในการให้เหตุผลที่ดีขึ้นผ่านกระบวนการฝึกอบรมสามขั้นตอนที่มีโครงสร้าง: การสร้างแบบจำลองภาษา, การปรับแต่งด้วยการควบคุม (SFT), และการปรับแต่งตามความชอบ โมเดลนี้รวมข้อมูลการให้เหตุผลที่มีความยาว, โมเดลการให้เหตุผลชั่วคราว, และการเรียนรู้เสริมกำลัง (RL) ขนาดใหญ่ ทำให้โดดเด่นในงานที่ต้องใช้เหตุผลโดยการสร้างโทเค็นการคิด มันใช้สถาปัตยกรรมแบบผสมของผู้เชี่ยวชาญ ซึ่งช่วยให้สามารถจัดการงานที่ต้องใช้เหตุผลซับซ้อนได้อย่างมีประสิทธิภาพ ถือเป็นความก้าวหน้าที่สำคัญในการออกแบบโมเดล AI

ปฏิกิริยา

DeepSeek-R1 กำลังสร้างการสนทนาเนื่องจากประสิทธิภาพและความคุ้มค่าของมันเมื่อเทียบกับโมเดลอย่าง GPT และ Gemini โดยมีผู้ใช้บางคนสังเกตเห็นปัญหาทั่วไปของโมเดลภาษาขนาดใหญ่ (LLM) โมเดลนี้มีความโดดเด่นในเรื่องความต้องการการประมวลผลที่ต่ำและเป็นโอเพ่นซอร์ส ซึ่งอาจทำให้เกิดการเปลี่ยนแปลงในวงการ AI และทำให้การพัฒนา AI เข้าถึงได้ง่ายขึ้น พัฒนาโดยกองทุนเฮดจ์ฟันด์ของจีน DeepSeek-R1 ทำให้เกิดคำถามเกี่ยวกับข้อมูลการฝึกอบรมและผลกระทบทางภูมิรัฐศาสตร์ แม้ว่าจะมีการวิจารณ์ที่หลากหลายเกี่ยวกับความสามารถในการเขียนโค้ดของมัน

การเรียนรู้ของเครื่องในกระบวนการผลิต (หลักสูตร CMU)

มหาวิทยาลัยคาร์เนกีเมลลอนเปิดสอนหลักสูตรชื่อ "Machine Learning in Production/AI Engineering" สำหรับภาคฤดูใบไม้ผลิปี 2025 โดยเน้นการสร้าง การปรับใช้ และการบำรุงรักษาผลิตภัณฑ์ซอฟต์แวร์ที่ใช้การเรียนรู้ของเครื่อง หลักสูตรนี้เน้นการปฏิบัติ AI อย่างรับผิดชอบและ MLOps (การดำเนินงานการเรียนรู้ของเครื่อง) ครอบคลุมวงจรชีวิตทั้งหมดตั้งแต่ต้นแบบจนถึงการผลิต ออกแบบสำหรับนักเรียนที่มีทักษะด้านวิทยาศาสตร์ข้อมูลและการเขียนโปรแกรมพื้นฐาน มีการบรรยาย ห้องปฏิบัติการ และโครงการกลุ่ม พร้อมทรัพยากรที่มีอยู่บน GitHub

ปฏิกิริยา

หลักสูตรของ CMU เกี่ยวกับการเรียนรู้ของเครื่องในภาคการผลิตแนะนำเครื่องมือที่ใช้งานได้จริง เช่น Kafka, Docker, Kubernetes, และ Jenkins โดยเน้นที่ MLOps (การดำเนินงานการเรียนรู้ของเครื่อง), ความสามารถในการอธิบาย, ความยุติธรรม, และการตรวจสอบ มันทำหน้าที่เป็นสะพานเชื่อมระหว่างการเรียนรู้ของเครื่องและระบบการผลิต แม้ว่าบางคนจะมองว่ามันเป็นระดับเริ่มต้นและเน้นไปที่การรวมเครื่องมือมากกว่าการเชี่ยวชาญ มีความกังวลเกี่ยวกับความเกี่ยวข้องในระยะยาวของเครื่องมือบางอย่างและการเน้นย้ำที่จำกัดของหลักสูตรในเรื่องคุณภาพของข้อมูล อย่างไรก็ตาม มันถูกมองว่าเป็นจุดเริ่มต้นใหม่สำหรับนักศึกษาวิทยาการคอมพิวเตอร์

Open-R1: การทำซ้ำแบบเปิดของ DeepSeek-R1

Open-R1 เป็นโครงการที่มุ่งหมายจะจำลอง DeepSeek-R1 ซึ่งเป็นโมเดลการให้เหตุผลที่เทียบเท่ากับ o1 ของ OpenAI โดยเน้นที่ความโปร่งใสและความร่วมมือแบบโอเพ่นซอร์ส โครงการนี้มุ่งที่จะสร้างชุดข้อมูลและกระบวนการฝึกอบรมของ DeepSeek-R1 ขึ้นมาใหม่ ซึ่งปัจจุบันยังไม่ได้เปิดเผย โดยใช้การเรียนรู้เสริมแรง (RL) โดยไม่ต้องมีการควบคุมจากมนุษย์ Open-R1 สนับสนุนการมีส่วนร่วมของชุมชนเพื่อขยายการประยุกต์ใช้โมเดลให้กว้างขวางเกินกว่าคณิตศาสตร์ รวมถึงสาขาต่าง ๆ เช่น การเขียนโค้ดและการแพทย์

ปฏิกิริยา

Open-R1 เป็นโครงการที่มุ่งเน้นการสร้างแบบจำลอง DeepSeek-R1 ขึ้นใหม่โดยใช้หลักการของโอเพ่นซอร์ส แม้ว่าจะยังไม่ใช่แบบจำลองที่แท้จริงในขณะนี้ การอภิปรายเน้นถึงความท้าทายและประโยชน์ที่อาจเกิดขึ้นจากการสร้างแบบจำลอง AI ขึ้นใหม่ด้วยงบประมาณที่จำกัด รวมถึงผลกระทบของ AI ต่อการศึกษาและผลกระทบต่อสังคมในวงกว้าง การสนทนายังเน้นถึงความตื่นเต้นเกี่ยวกับความก้าวหน้าทางเทคโนโลยีและบทบาทของการเคลื่อนไหวแบบโอเพ่นซอร์สในการทำให้ AI เข้าถึงได้มากขึ้นสำหรับผู้ชมที่กว้างขึ้น

อนาคตของ Rebble

ปฏิกิริยา

การสนทนานี้เน้นถึงความคิดถึงสำหรับนาฬิกาอัจฉริยะ Pebble ที่ได้รับการชื่นชมสำหรับหน้าจอที่คล้าย e-ink และอายุการใช้งานแบตเตอรี่ที่ยาวนาน และตั้งคำถามว่าทำไมเทคโนโลยีที่คล้ายกันจึงไม่ได้รับการยอมรับอย่างกว้างขวางมากขึ้น มีความสนใจในศักยภาพของฮาร์ดแวร์ใหม่จาก Rebble ซึ่งเป็นโครงการที่ขับเคลื่อนโดยชุมชน และลักษณะโอเพ่นซอร์สของโครงการสมาร์ทวอทช์ที่เกี่ยวข้อง มีการกล่าวถึงทางเลือกอย่าง Watchy และ PineTime โดยผู้ใช้ได้สังเกตถึงความท้าทายด้านซอฟต์แวร์ที่พบในพื้นที่สมาร์ทวอทช์แบบโอเพ่นซอร์ส

ตำนานอัลฟ่า: หมาป่าที่ถูกกักขังทำให้เราเข้าใจผิดได้อย่างไร

ปฏิกิริยา

แนวคิดเรื่อง "อัลฟ่าตัวผู้" ในหมาป่า ซึ่งเดิมอิงจากการศึกษาหมาป่าในกรง ถูกหักล้างแล้ว; ฝูงหมาป่าในธรรมชาติทำงานคล้ายกับหน่วยครอบครัวมากกว่าที่จะเป็นโครงสร้างลำดับชั้น แม้จะถูกหักล้างแล้ว แต่แนวคิด "อัลฟ่า" ยังคงอยู่เนื่องจากความน่าสนใจในสภาพแวดล้อมที่มีการแข่งขัน เช่น ซิลิคอนแวลลีย์ และการตอบสนองต่อความต้องการทางสังคมและจิตวิทยาบางประการ ความเชื่อที่ยังคงมีอยู่ในตำนาน "อัลฟ่า" เน้นให้เห็นว่านิทานสามารถมีอิทธิพลต่อการรับรู้ของเราเกี่ยวกับพลวัตทางสังคมได้อย่างไร แม้ว่าจะมีพื้นฐานมาจากสมมติฐานที่ไม่ถูกต้องก็ตาม

เครื่องมือ go ของ Go 1.24 เป็นหนึ่งในส่วนเพิ่มเติมที่ดีที่สุดในระบบนิเวศในรอบหลายปี

Go 1.24 แนะนำคำสั่ง go tool ใหม่และคำสั่ง tool ใน go.mod เพื่อเพิ่มประสิทธิภาพการจัดการเครื่องมือโครงการในระบบนิเวศของ Go การอัปเดตนี้แก้ไขปัญหาที่เกี่ยวข้องกับรูปแบบ tools.go เช่น ผลกระทบต่อประสิทธิภาพและการขยายตัวของต้นไม้การพึ่งพา โดยการอนุญาตให้มีการจัดการเครื่องมือที่มีประสิทธิภาพมากขึ้นและลดการพึ่งพาที่ไม่จำเป็น ในขณะที่คำสั่ง go tool ปรับปรุงประสิทธิภาพโดยการแคชการเรียกใช้ go run มีความกังวลเกี่ยวกับการพึ่งพาเครื่องมือที่ถูกจัดการเป็นทางอ้อม ซึ่งอาจนำไปสู่การปะทะกันของการพึ่งพาได้

ปฏิกิริยา

การแนะนำ "go tool" ใน Go 1.24 ได้ก่อให้เกิดการถกเถียงเกี่ยวกับผลกระทบต่อการจัดการการพึ่งพา โดยมีความกังวลเกี่ยวกับการรวมเครื่องมือและการพึ่งพาโครงการที่อาจทำให้เกิดความขัดแย้ง นักวิจารณ์เสนอทางเลือกเช่นไฟล์โมดูลแยกต่างหากหรือการใช้เครื่องมือเช่น Nix เพื่อการควบคุมเวอร์ชันที่ดีขึ้น ผู้สนับสนุนแนวทางของ Go โต้แย้งว่ามันเสนอความเรียบง่ายและประสิทธิภาพ ซึ่งสะท้อนถึงความท้าทายที่กว้างขึ้นในการจัดการการพึ่งพาในภาษาการเขียนโปรแกรมต่าง ๆ

ฉันเชื่อใจ LLM ตอนนี้ฉันอยู่ในวันที่ 4 ของโครงการช่วงบ่าย

ผู้เขียนได้เริ่มโครงการที่ชื่อว่า Deskthang โดยมีความตั้งใจที่จะสร้างอุปกรณ์บนโต๊ะทำงานโดยใช้ Raspberry Pi Pico, จอแสดงผล LCD และไฟ LED RGB พร้อมทั้งทดสอบความสามารถของ AI เครื่องมือ AI อย่าง ChatGPT และ Claude ช่วยในขั้นต้นแต่สุดท้ายกลับนำไปสู่การใช้งานที่มีข้อบกพร่อง ทำให้เกิดปัญหาเช่นความขัดแย้งของบัฟเฟอร์และการเสียหายของข้อมูล บทเรียนสำคัญที่ได้เรียนรู้รวมถึงการยอมรับว่า AI เป็นเครื่องมือมากกว่าการเป็นผู้ช่วยร่วม, การเข้าใจถึงคุณค่าของความขัดแย้งและความผิดพลาดในการเรียนรู้, และความสำคัญของความอดทนมากกว่าความมั่นใจเกินไป

ปฏิกิริยา

โมเดลภาษาขนาดใหญ่ (LLMs) สามารถเป็นประโยชน์สำหรับงานง่าย ๆ แต่หากพึ่งพาสำหรับปัญหาที่ซับซ้อนโดยไม่มีการควบคุมดูแลที่เหมาะสม อาจทำให้ระยะเวลาของโครงการยืดเยื้อออกไปได้ พวกเขามีประสิทธิภาพในการสังเคราะห์ข้อมูล แต่ก็อาจมีปัญหาในการจัดการกับหัวข้อเฉพาะหรือความรู้ใหม่ ๆ ซึ่งต้องการให้ผู้ใช้มีพื้นฐานที่แข็งแกร่งและประสบการณ์ ผู้ใช้ต้องรักษาการควบคุมโดยการให้คำสั่งที่ชัดเจนและตรวจสอบผลลัพธ์อย่างวิจารณ์เพื่อใช้ศักยภาพของ LLMs อย่างเต็มที่

มูลค่าตลาดของ Nvidia ลดลงเกือบ 600 พันล้านดอลลาร์

Nvidia สูญเสียมูลค่าตลาดอย่างประวัติศาสตร์เกือบ 600 พันล้านดอลลาร์ โดยหุ้นลดลง 17% เนื่องจากความกังวลเกี่ยวกับการแข่งขันจากห้องปฏิบัติการ AI ของจีน DeepSeek การขายออกส่งผลกระทบต่อภาคเทคโนโลยีของสหรัฐฯ โดยรวม ทำให้บริษัทต่างๆ เช่น Dell และ Oracle มีการลดลง และส่งผลให้ดัชนี Nasdaq ลดลง 3.1% โมเดล AI ใหม่ของ DeepSeek ที่พัฒนาด้วยชิป H800 ของ Nvidia ได้เพิ่มความกังวลเกี่ยวกับการแข่งขัน ส่งผลกระทบต่อหุ้นของ Nvidia แม้จะมีกำไรก่อนหน้านี้ และลดมูลค่าสุทธิของ CEO Jensen Huang ลงถึง 21 พันล้านดอลลาร์

ปฏิกิริยา

มูลค่าตลาดของ Nvidia ประสบกับการลดลงอย่างมากเกือบ 600 พันล้านดอลลาร์ ทำให้เกิดการถกเถียงเกี่ยวกับการประเมินมูลค่าของบริษัทและว่ามันถูกประเมินค่าสูงเกินไปหรือไม่ แม้จะมีปฏิกิริยาจากตลาด แต่ GPU ของ Nvidia ยังคงมีความสำคัญต่อการทำงานที่เกี่ยวข้องกับ AI ซึ่งเน้นย้ำถึงความสำคัญของพวกมันในอุตสาหกรรมเทคโนโลยี การที่สื่อมุ่งเน้นไปที่การสูญเสียทางการเงินขนาดใหญ่โดยไม่พิจารณาอัตราเงินเฟ้ออาจทำให้เข้าใจผิดได้ แต่การลดลงของ Nvidia นั้นโดดเด่นแม้ในหมู่บริษัทใหญ่ ๆ

Janus Pro 1B ทำงาน 100% ในเบราว์เซอร์โดยใช้ WebGPU

ปฏิกิริยา

Janus Pro 1B เป็นโมเดลที่ทำงานในเบราว์เซอร์โดยใช้ WebGPU ซึ่งแสดงถึงความสามารถในการรันโมเดล AI ในสภาพแวดล้อมของเบราว์เซอร์ แม้ว่าจะมีจำนวนพารามิเตอร์ต่ำซึ่งจำกัดความสามารถของมัน แต่โมเดลนี้สามารถทำงานบน GPU ระดับล่างได้ ซึ่งเน้นถึงการเข้าถึงได้ง่าย แม้ว่าผลลัพธ์การสร้างภาพจะไม่สม่ำเสมอ แต่ความสามารถในการรันโมเดลดังกล่าวในเบราว์เซอร์ถือเป็นความก้าวหน้าทางเทคโนโลยีที่สำคัญ แม้ว่าปัจจุบันจะไม่รองรับอุปกรณ์เคลื่อนที่ก็ตาม

นักวิจัยจากเบิร์กลีย์จำลองเทคโนโลยีหลักของ DeepSeek R1 ด้วยงบเพียง $30: การปรับแต่งเล็กน้อย

ปฏิกิริยา

นักวิจัยจากเบิร์กลีย์ได้ทำการจำลองเทคโนโลยีหลักของ DeepSeek R1 ได้สำเร็จด้วยงบประมาณเพียง 30 ดอลลาร์ โดยมุ่งเน้นไปที่งานเฉพาะ เช่น การเล่นเกม Countdown นวัตกรรมนี้เกี่ยวข้องกับการใช้การเรียนรู้แบบเสริมแรง ซึ่งเป็นประเภทของการเรียนรู้ของเครื่องที่ตัวแทนเรียนรู้โดยการโต้ตอบกับสภาพแวดล้อมของมัน เพื่อเพิ่มประสิทธิภาพของโมเดลการให้เหตุผล แม้ว่าการประยุกต์ใช้จะจำกัดอยู่ในพื้นที่ที่มีวิธีแก้ปัญหาที่สามารถตรวจสอบได้เท่านั้น การอภิปรายเน้นถึงศักยภาพในการพัฒนาตนเองของ AI และผลกระทบต่อการพัฒนา AI ในอนาคต แม้จะมีการวิจารณ์เกี่ยวกับชื่อบทความที่ทำให้เข้าใจผิดและการขาดลิงก์แหล่งข้อมูลที่เหมาะสม