Skip to main content

2024-10-11

2 ดอลลาร์ H100s: ฟองสบู่การเช่า GPU แตกอย่างไร

  • ตลาด GPU ได้ประสบกับการลดราคาที่สำคัญ โดย GPU รุ่น H100 ลดลงจาก $8/ชั่วโมง เหลือไม่ถึง $2/ชั่วโมง เนื่องจากอุปทานเกินและการเปลี่ยนแปลงในความต้องการ - ปัจจัยที่มีส่วนทำให้เกิดการเปลี่ยนแปลงนี้รวมถึงการขายต่อการคำนวณที่จองไว้ การปรับแต่งโมเดลแบบเปิด และการลดลงของบริษัทโมเดลพื้นฐานใหม่ ทำให้การเช่า GPU น่าสนใจกว่าการซื้อ - การเกิดขึ้นของโมเดลน้ำหนักเปิดและทางเลือกที่มีราคาถูกกว่า เช่น GPU ของ AMD และ Intel กำลังมีอิทธิพลต่อตลาด โดยมีการเน้นที่การอนุมาน AI และการปรับแต่งที่เพิ่มขึ้น ซึ่งได้รับการสนับสนุนจากแพลตฟอร์มเช่น Featherless.AI ที่เสนอวิธีแก้ปัญหา AI ที่คุ้มค่า

ปฏิกิริยา

  • ตลาดเช่า GPU ได้ประสบกับการลดราคาที่น่าทึ่งสำหรับ H100 GPUs จาก $8/ชั่วโมง เหลือ $2/ชั่วโมง เนื่องจากมีอุปทานเกินและความต้องการที่ลดลงจากบริษัทโมเดลพื้นฐานใหม่ ๆ
  • การลดราคานี้ได้ทำให้ฟองสบู่การเช่า GPU แตก ส่งผลกระทบต่อนักลงทุนที่ลงทุนอย่างหนักในโครงสร้างพื้นฐานของ GPU
  • บทความนี้สำรวจถึงศักยภาพในการสร้างภูมิทัศน์ AI ที่เข้าถึงได้มากขึ้นด้วยตัวเลือกการคำนวณที่ถูกลง แม้ว่าความยั่งยืนในระยะยาวของราคาที่ต่ำเหล่านี้และอนาคตของโครงสร้างพื้นฐาน AI จะยังไม่แน่นอน

เทสลา โรโบแท็กซี่

ปฏิกิริยา

  • เมื่อเร็ว ๆ นี้ Tesla ได้แสดงให้เห็นถึง Robotaxi ของตน โดยเน้นวิสัยทัศน์สำหรับแท็กซี่อัตโนมัติที่แตกต่างจากแนวทางของ Waymo ซึ่งใช้ฮาร์ดแวร์ที่มีราคาสูงเช่น LiDAR.- การออกแบบของ Robotaxi ที่ไม่มีพวงมาลัยบ่งบอกถึงอนาคตที่พึ่งพาการขับเคลื่อนอัตโนมัติเต็มรูปแบบ แม้ว่าจะต้องเผชิญกับความท้าทายด้านกฎระเบียบและเทคโนโลยี.- เทคโนโลยี Full Self-Driving (FSD) ของ Tesla เป็นหัวข้อที่มีการถกเถียงกัน โดยมีนักวิจารณ์ตั้งคำถามถึงความพร้อมในการขับขี่โดยไม่ต้องมีการควบคุมดูแล และผู้สนับสนุนที่มองในแง่ดีเกี่ยวกับศักยภาพของมัน

เริ่มปิดใช้งานส่วนขยายที่ติดตั้งซึ่งยังคงใช้ Manifest V2 ใน Chrome stable

  • Google กำลังยกเลิกการใช้ Manifest V2 สำหรับส่วนขยายของ Chrome โดยจะเริ่มมีการเตือนและปิดใช้งานส่วนขยายเหล่านี้ในช่องทางก่อนเสถียรตั้งแต่วันที่ 9 ตุลาคม 2024
  • ผู้ใช้ได้รับการสนับสนุนให้เปลี่ยนไปใช้ทางเลือกของ Manifest V3 โดยองค์กรมีเวลาจนถึงเดือนมิถุนายน 2025 ในการดำเนินการเปลี่ยนแปลงโดยใช้นโยบาย ExtensionManifestV2Availability
  • กระบวนการยกเลิกเริ่มต้นเมื่อวันที่ 3 มิถุนายน 2024 และ Chrome Web Store ไม่รับส่วนขยาย Manifest V2 ใหม่ตั้งแต่เดือนมิถุนายน 2022 สำหรับส่วนขยายส่วนตัวและตั้งแต่เดือนมกราคม 2022 สำหรับส่วนขยายสาธารณะหรือที่ไม่ได้ลงรายการ

ปฏิกิริยา

  • Chrome กำลังเปลี่ยนจากส่วนขยาย Manifest V2 ไปเป็น Manifest V3 ซึ่งส่งผลกระทบต่อโปรแกรมบล็อกโฆษณาเช่น uBlock Origin โดยจำกัดความสามารถของพวกมัน ในขณะที่ Chrome กำลังทำการเปลี่ยนแปลงนี้ เบราว์เซอร์อย่าง Firefox, Vivaldi และ Brave มีความตั้งใจที่จะสนับสนุน Manifest V2 ต่อไปในขณะนี้ การเปลี่ยนแปลงนี้ได้กระตุ้นให้เกิดการสนทนาเกี่ยวกับการควบคุมและความเป็นส่วนตัวของผู้ใช้ โดยมีผู้ใช้บางคนพิจารณาที่จะเปลี่ยนไปใช้เบราว์เซอร์ทางเลือกเพื่อรักษาคุณสมบัติการบล็อกโฆษณาที่มีประสิทธิภาพ

คอมไพเลอร์ Lisp ไปยัง RISC-V ที่เขียนด้วย Lisp

  • uLisp เป็นเวอร์ชันของภาษาโปรแกรม Lisp ที่ออกแบบมาสำหรับไมโครคอนโทรลเลอร์ รองรับแพลตฟอร์มเช่น Arduino, Raspberry Pi และ ESP32.- มันมีฟีเจอร์ต่างๆ เช่น การดีบัก, อินเทอร์เฟซการ์ด SD, และอินเทอร์เฟซอนุกรม I2C/SPI พร้อมตัวอย่างสำหรับแอปพลิเคชันเช่น การกระพริบ LED และการบันทึกข้อมูล.- ฟีเจอร์ที่สำคัญคือคอมไพเลอร์ Lisp สำหรับ RISC-V ซึ่งคอมไพล์ฟังก์ชัน Lisp เป็นโค้ดเครื่อง รองรับฟังก์ชันแบบเรียกซ้ำและการปรับแต่งการเรียกซ้ำท้ายเพื่อปรับปรุงประสิทธิภาพ

ปฏิกิริยา

  • คอมไพเลอร์ Lisp สำหรับ RISC-V ที่เขียนด้วย Lisp กำลังอยู่ในระหว่างการพัฒนา แต่ยังขาดการดำเนินการและฟังก์ชันบางอย่างที่จะทำให้สามารถคอมไพล์ตัวเองได้ - คอมไพเลอร์รองรับฟังก์ชัน Lisp พื้นฐานเช่น car และ cdr แต่ยังไม่สมบูรณ์ - uLisp ถูกเน้นถึงความเรียบง่ายและความเหมาะสมสำหรับไมโครคอนโทรลเลอร์ โดย RISC-V เป็นแพลตฟอร์มที่น่าสนใจสำหรับผู้ที่ชื่นชอบเทคโนโลยีและแฮกเกอร์

รางวัลโนเบลสาขาสันติภาพประจำปี 2024 มอบให้กับ Nihon Hidankyo

  • รางวัลโนเบลสาขาสันติภาพประจำปี 2024 ได้รับการมอบให้กับ Nihon Hidankyo ซึ่งเป็นองค์กรของผู้รอดชีวิตจากระเบิดปรมาณูในญี่ปุ่นที่รู้จักกันในชื่อ Hibakusha สำหรับการรณรงค์เพื่อโลกที่ปลอดนิวเคลียร์ - Hibakusha ได้มีส่วนสำคัญในการสร้าง "ข้อห้ามนิวเคลียร์" ซึ่งเป็นบรรทัดฐานระดับโลกที่ต่อต้านการใช้อาวุธนิวเคลียร์ ผ่านคำให้การที่มีผลกระทบของพวกเขา - การยอมรับนี้สอดคล้องกับวิสัยทัศน์ของอัลเฟรด โนเบลในการยกย่องความพยายามที่เป็นประโยชน์ต่อมนุษยชาติและยังคงสร้างแรงบันดาลใจให้กับคนรุ่นใหม่ในการปลดอาวุธนิวเคลียร์

ปฏิกิริยา

  • รางวัลโนเบลสาขาสันติภาพประจำปี 2024 ถูกมอบให้กับ Nihon Hidankyo ซึ่งเป็นองค์กรญี่ปุ่นที่รณรงค์ต่อต้านอาวุธนิวเคลียร์ เน้นย้ำถึงภัยคุกคามที่ยังคงมีอยู่ของอาวุธนิวเคลียร์ท่ามกลางความตึงเครียดทั่วโลก - รางวัลนี้ทำหน้าที่เป็นเครื่องเตือนใจถึงผลกระทบที่ทำลายล้างของสงครามนิวเคลียร์ ดังที่เห็นได้จากฮิโรชิมาและนางาซากิ และเน้นย้ำถึงความสำคัญของการลดอาวุธ - การอภิปรายเกี่ยวกับรางวัลนี้ยังเกี่ยวข้องกับความซับซ้อนของการยับยั้งนิวเคลียร์ กฎหมายระหว่างประเทศ และพลวัตทางภูมิรัฐศาสตร์ระหว่างมหาอำนาจนิวเคลียร์

ทางเลือกแทน WordPress

  • บทความได้รับการอัปเดตเพื่อรวมทางเลือกของระบบจัดการเนื้อหา (CMS) เพิ่มเติมเนื่องจากความสนใจที่เพิ่มขึ้น โดยเฉพาะอย่างยิ่งในสถานการณ์ปัจจุบันของ WordPress - รายการนี้มีตัวเลือก CMS ที่สามารถดาวน์โหลดได้ เช่น Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail, และ Textpattern โดยไม่รวม CMS ที่ใช้ API และ git - การกล่าวถึงที่น่าสนใจรวมถึง Ghost สำหรับคุณสมบัติอีเมลในตัว, Kirby สำหรับวิธีการที่ใช้ไฟล์, และ ClassicPress ในฐานะ WordPress fork ที่นำโดยชุมชน ในขณะที่ CMS บางตัวเช่น Anchor ไม่ได้รับการดูแลอีกต่อไป

ปฏิกิริยา

  • Jekyll บน GitHub Pages แนะนำสำหรับบล็อกง่าย ๆ ที่ใช้ Markdown โดยมีความง่ายในการใช้งานโดยไม่ต้องตั้งค่าท้องถิ่น และอนุญาตให้เนื้อหาสามารถพกพาข้ามแพลตฟอร์มได้
  • ทางเลือกอื่นสำหรับการเขียนบล็อกนอกเหนือจาก WordPress ได้แก่ Chyrp Lite, Typecho, Quartz, และ Logseq ในขณะที่ Drupal, ProcessWire, และ Wagtail มอบความยืดหยุ่นมากขึ้นสำหรับนักพัฒนา
  • เครื่องมือสร้างเว็บไซต์แบบสแตติก เช่น Astro และ Publii กำลังได้รับความนิยมมากขึ้นเรื่อย ๆ และสำหรับการโฮสต์ภาพ ตัวเลือกอย่าง S3+Cloudfront หรือ CloudFlare ถูกแนะนำ

Google Play ฆ่าเกมของฉันและไม่บอกเหตุผลว่าทำไม

  • ทัคคุน นักพัฒนาเกมอินดี้ ได้ทำงานในเกม "Anti-Idle: Reborn" ซึ่งได้รับการอนุมัติจาก Google และ Apple และอยู่ในช่วง Closed Beta มาเป็นเวลาหนึ่งเดือน - เมื่อวันที่ 7 ตุลาคม 2024 Google ได้ยกเลิกบัญชีของทัคคุนโดยอ้างถึง "การละเมิดก่อนหน้า" และ "พฤติกรรมที่มีความเสี่ยงสูง" แต่ไม่ได้ให้คำอธิบายที่ชัดเจน ส่งผลกระทบต่อการทำงานและรายได้ของเขา - สถานการณ์นี้เน้นถึงปัญหาที่กว้างขึ้นที่นักพัฒนาประสบกับการยกเลิกบัญชีที่ไม่ชัดเจน กระตุ้นให้มีการเรียกร้องความโปร่งใสและความชัดเจนมากขึ้นจากแพลตฟอร์มเช่น Google

ปฏิกิริยา

  • Google Play ลบเกมของนักพัฒนาโดยไม่มีคำอธิบาย ซึ่งเน้นย้ำถึงการควบคุมที่สำคัญที่บริษัทเทคโนโลยีมีต่อนักพัฒนา
  • มีรายงานเหตุการณ์ที่คล้ายกันกับ Amazon และ Google ซึ่งบัญชีหรือแอปถูกแบนโดยไม่มีเหตุผลที่ชัดเจนหรือการสนับสนุนที่เพียงพอ
  • นักพัฒนาถูกกระตุ้นให้กระจายแพลตฟอร์มของตนเพื่อบรรเทาความเสี่ยง เนื่องจากสถานการณ์นี้เน้นย้ำถึงความกังวลที่กว้างขึ้นเกี่ยวกับการบริการลูกค้าของยักษ์ใหญ่ด้านเทคโนโลยีและความเสี่ยงจากการพึ่งพาการสร้างธุรกิจบนแพลตฟอร์มของพวกเขา

หน่วยลาดตระเวน Nurdle

ปฏิกิริยา

  • ในปี 2023 มีตู้คอนเทนเนอร์ขนส่งจำนวน 221 ตู้สูญหายในทะเล ซึ่งเป็นจำนวนเล็กน้อยเมื่อเทียบกับ 250 ล้านตู้ที่ขนส่งต่อปี แสดงให้เห็นถึงขนาดของการดำเนินงานขนส่งทั่วโลก
  • เม็ดพลาสติกที่เรียกว่านูร์เดิลเป็นมลพิษที่มองเห็นได้บนชายหาดและสามารถย่อยสลายเป็นไมโครพลาสติก เข้าสู่ห่วงโซ่อาหารและอาจก่อให้เกิดอันตรายได้ แม้ว่าพวกมันจะไม่ใช่แหล่งหลักของมลพิษพลาสติกในทะเลก็ตาม
  • การอภิปรายเกี่ยวกับมลพิษจากพลาสติกเน้นย้ำถึงความซับซ้อนและผลกระทบระดับโลก รวมถึงการส่งออกปัญหาขยะจากประเทศพัฒนาแล้วไปยังประเทศกำลังพัฒนา และการปรับตัวที่อาจเกิดขึ้นของระบบนิเวศต่อมลพิษจากพลาสติก ซึ่งก่อให้เกิดความกังวลเกี่ยวกับการใช้พลาสติกในอนาคต

บทเรียนเบื้องต้นเกี่ยวกับประสิทธิภาพของ CUDA

  • Malte Skarupke พูดถึงประสบการณ์ของเขาในการเรียนรู้ CUDA โดยสังเกตว่ามันเป็น C++ ที่มีฟีเจอร์เพิ่มเติมสำหรับการคำนวณแบบขนาน
  • บทเรียนสำคัญสำหรับการเพิ่มประสิทธิภาพ CUDA ได้แก่ การรวมหน่วยความจำ, การทำความเข้าใจประเภทหน่วยความจำต่าง ๆ, และการเพิ่มขีดความสามารถในการประมวลผลแบบขนานโดยใช้เธรดจำนวนมากและแยกงานออกเป็นเคอร์เนลต่าง ๆ
  • สการุปเก้เน้นว่าการเขียน CUDA นั้นคล้ายกับการแก้ปริศนา โดยที่จุดสนใจหลักควรอยู่ที่การรันงานแบบขนานก่อนที่จะปรับให้เหมาะสมสำหรับความเร็ว

ปฏิกิริยา

  • การอภิปรายมุ่งเน้นไปที่การเพิ่มประสิทธิภาพของโค้ด CUDA สำหรับการทำงานของ GPU โดยเฉพาะสำหรับทริกเกอร์การทดลอง LHC (Large Hadron Collider) โดยการจัดการรีจิสเตอร์ หน่วยความจำที่ใช้ร่วมกัน และบล็อกเธรด
  • มันเน้นถึงการแลกเปลี่ยนระหว่างการครอบครอง (จำนวนเธรดที่ใช้งาน), การใช้รีจิสเตอร์, และความหน่วงของหน่วยความจำ โดยเน้นถึงวิวัฒนาการของข้อจำกัดในการเขียนโปรแกรมใน CUDA
  • การสนทนานี้เปรียบเทียบประสิทธิภาพของ GPU และ CPU โดยสังเกตถึงความแตกต่างในด้านการใช้พลังงานและความสามารถในการคำนวณ และเน้นความสำคัญของการปรับสมดุลระหว่างการใช้งานและประสิทธิภาพสำหรับการพัฒนาฮาร์ดแวร์และซอฟต์แวร์ในอนาคต

FBI สร้างเหรียญเพื่อสืบสวนโครงการปั่นราคาและทิ้งในตลาดคริปโต

  • เอฟบีไอพัฒนาสกุลเงินดิจิทัลบนพื้นฐานของ Ethereum ชื่อ NexFundAI เพื่อสืบสวนและเปิดโปงแผนการปั่นราคาและทิ้งราคาของคริปโต นำไปสู่การดำเนินการทางกฎหมายที่สำคัญ - มีการยื่นฟ้องต่อบุคคลและหน่วยงาน 18 รายในข้อหาฉ้อโกงและการบิดเบือนตลาด โดยคณะกรรมการกำกับหลักทรัพย์และตลาดหลักทรัพย์ได้มุ่งเป้าไปที่ผู้ทำตลาดสามรายและอีกเก้ารายที่ทำให้ราคาสินทรัพย์คริปโตสูงเกินจริง - กระทรวงยุติธรรมสามารถกู้คืนเงินที่ได้จากการฉ้อโกงจำนวน 25 ล้านดอลลาร์ ซึ่งจะถูกส่งคืนให้กับนักลงทุน แสดงให้เห็นถึงประสิทธิภาพของปฏิบัติการในการต่อสู้กับการฉ้อโกงคริปโต

ปฏิกิริยา

  • FBI ได้พัฒนาสกุลเงินดิจิทัลเพื่อสืบสวนแผนการปั่นราคาและขายทิ้ง ซึ่งเป็นการกระทำที่ฉ้อโกงโดยการเพิ่มราคาของสินทรัพย์อย่างไม่เป็นธรรมก่อนที่จะขายออกไป
  • โครงการนี้ได้จุดประกายการถกเถียงเกี่ยวกับการล่อจับและผลกระทบทางจริยธรรมของการบังคับใช้กฎหมายที่สร้างหลักทรัพย์ปลอม
  • การอภิปรายขยายไปถึงความกังวลที่กว้างขึ้นเกี่ยวกับความชอบธรรมของสกุลเงินดิจิทัลและบทบาทของรัฐบาลในการควบคุมสกุลเงินดิจิทัล

NotesHub: แอปจดบันทึกข้ามแพลตฟอร์มที่ใช้ Markdown

  • แอปนี้มีให้ใช้งานบนหลายแพลตฟอร์ม รวมถึง iOS, Android, Windows, Mac, Apple Vision Pro และเว็บ โดยเวอร์ชันเว็บเป็น Progressive Web App ฟรีที่ทำงานแบบออฟไลน์ได้ - สามารถเก็บบันทึกใน Git repositories โดยมีการผสานรวมที่ดีที่สุดกับ GitHub และยังรองรับตัวเลือกที่โฮสต์เองได้ เช่น Gitea, ระบบไฟล์ หรือ iCloud Drive - แอปรองรับไวยากรณ์ Markdown ที่หลากหลายพร้อมส่วนขยายสำหรับสร้างบอร์ด Kanban, กระดานไวท์บอร์ดที่ใช้ Excalidraw และรวมถึงฟีเจอร์อย่าง Mermaid และการบันทึกโน้ตเพลง ABC

ปฏิกิริยา

  • NotesHub เป็นแอปจดบันทึกที่ยืดหยุ่นและใช้ Markdown ซึ่งสามารถใช้งานได้บนหลายแพลตฟอร์ม รวมถึง iOS, Android, Windows, Mac, Apple Vision Pro และเว็บ - แอปนี้มีเวอร์ชัน Progressive Web App ฟรี ในขณะที่เวอร์ชันเนทีฟต้องชำระเงินครั้งเดียว โดยมีการผสานรวมที่แข็งแกร่งสำหรับการจัดเก็บบันทึกในที่เก็บ Git เช่น GitHub, GitLab หรือ Bitbucket - มีคุณสมบัติไวยากรณ์ Markdown ที่หลากหลาย, กระดาน Kanban และไวท์บอร์ดที่ใช้ Excalidraw โดยผู้ใช้ชื่นชมการออกแบบที่สะอาดตาและความสามารถในการใช้งานแบบออฟไลน์ แม้ว่าจะไม่เปิดซอร์สและมีการสนับสนุน Linux ที่จำกัด

สวิตช์คนตายโดยไม่ต้องพึ่งพาโครงสร้างพื้นฐานของคุณ

  • โครงการ Go ใหม่ชื่อ Deadcheck ได้รับการพัฒนาให้ทำหน้าที่เป็นสวิตช์ของคนตายโดยไม่ต้องพึ่งพางาน cron, ตัวจับเวลา หรือฐานข้อมูล - Deadcheck ผสานรวมกับ PagerDuty ซึ่งเป็นแพลตฟอร์มการจัดการเหตุการณ์ที่ได้รับความนิยม เพื่อให้เหตุการณ์อยู่ในสถานะพักจนกว่าจะพลาดการเช็คอิน ซึ่งในจุดนั้นจะทำให้เกิดการแจ้งเตือน - โครงการนี้มีความโดดเด่นในด้านวิธีการที่เป็นนวัตกรรมในการจัดการการแจ้งเตือนและเหตุการณ์โดยไม่ต้องพึ่งพาการจัดตารางเวลาแบบดั้งเดิมหรือฐานข้อมูล

ปฏิกิริยา

  • Deadcheck เป็นโปรเจกต์ที่พัฒนาด้วยภาษา Go ออกแบบมาเป็นสวิตช์แบบ dead man's switch โดยไม่ต้องใช้ cron jobs หรือฐานข้อมูล และสามารถผสานรวมกับ PagerDuty เพื่อจัดการการแจ้งเตือน
  • โครงการนี้ได้จุดประกายการอภิปรายเกี่ยวกับสวิตช์ของคนตาย รวมถึงแง่มุมทางกฎหมายและทางเลือกอื่น ๆ เช่น การใช้ทนายความหรือระบบบล็อกเชน
  • ผู้ใช้ได้แนะนำบริการที่มีอยู่แล้วเช่น Cronitor หรือ OpsGenie สำหรับฟังก์ชันการทำงานที่คล้ายกัน และโครงการมีแผนที่จะขยายการผสานรวมไปไกลกว่า PagerDuty

การทำความเข้าใจข้อจำกัดของการใช้เหตุผลทางคณิตศาสตร์ในโมเดลภาษาขนาดใหญ่

  • บทความ "GSM-Symbolic" โดย Iman Mirzadeh และคณะ สำรวจความสามารถในการใช้เหตุผลทางคณิตศาสตร์ของโมเดลภาษาขนาดใหญ่ (LLMs) โดยใช้เกณฑ์มาตรฐาน GSM8K - ผู้เขียนแนะนำ GSM-Symbolic ซึ่งเป็นเกณฑ์มาตรฐานใหม่ที่มีแม่แบบเชิงสัญลักษณ์ แสดงให้เห็นว่า LLMs มีปัญหาในการเปลี่ยนแปลงค่าตัวเลขและประโยคเพิ่มเติมในคำถาม - การศึกษาชี้ให้เห็นว่า LLMs อาจทำซ้ำการใช้เหตุผลจากข้อมูลการฝึกอบรมแทนที่จะทำการใช้เหตุผลเชิงตรรกะอย่างแท้จริง ซึ่งเน้นถึงข้อจำกัดของพวกเขาในการใช้เหตุผลทางคณิตศาสตร์

ปฏิกิริยา

  • โมเดลภาษาขนาดใหญ่ (LLMs) เผชิญกับความท้าทายในการให้เหตุผลทางคณิตศาสตร์ โดยเฉพาะเมื่อปัญหามีข้อมูลที่ไม่เกี่ยวข้อง ซึ่งส่งผลต่อประสิทธิภาพของพวกเขา ข้อจำกัดนี้เน้นย้ำถึงการพึ่งพาการจดจำรูปแบบมากกว่าการให้เหตุผลเชิงตรรกะของ LLMs ทำให้พวกเขามีประสิทธิภาพน้อยลงในสถานการณ์จริงที่มีรายละเอียดที่ไม่จำเป็น แม้จะมีความก้าวหน้า แต่ LLMs ยังคงมีปัญหาในการแยกแยะข้อมูลสำคัญจากเสียงรบกวน ซึ่งเป็นทักษะสำคัญที่จำเป็นสำหรับการใช้งานในทางปฏิบัติ

ARIA: โมเดลผู้เชี่ยวชาญผสมแบบเนทีฟหลายรูปแบบที่เปิดกว้าง

  • Aria เป็นโมเดล AI แบบมัลติโหมดที่เปิดกว้างซึ่งผสานรวมข้อมูลจริงที่หลากหลายเพื่อความเข้าใจที่ครอบคลุม โดยมีประสิทธิภาพเหนือกว่าโมเดลอย่าง Pixtral-12B และ Llama3.2-11B - เป็นโมเดลแบบผสมผู้เชี่ยวชาญที่มีพารามิเตอร์ที่เปิดใช้งาน 3.9 พันล้านและ 3.5 พันล้านต่อโทเค็นภาพและข้อความตามลำดับ ซึ่งช่วยเพิ่มความสามารถด้านภาษาและมัลติโหมด - น้ำหนักและฐานรหัสของโมเดลนี้เปิดให้ใช้งานแบบโอเพ่นซอร์ส ทำให้นักพัฒนาและนักวิจัยสามารถนำไปใช้และปรับแต่งได้ง่าย

ปฏิกิริยา

  • ARIA เป็นโมเดล Mixture-of-Experts (MoE) แบบมัลติโหมดใหม่ที่มีประสิทธิภาพและความเร็วในการประมวลผลเหนือกว่า Pixtral-12B และ Llama3.2-11B โดยใช้พารามิเตอร์ที่ใช้งานอย่างมีประสิทธิภาพ แม้ว่าจะมีการใช้หน่วยความจำคล้ายกับโมเดลขนาด 25B แต่ ARIA ทำงานได้เหมือนโมเดลขนาด 10B และทำงานได้รวดเร็วเท่ากับโมเดลขนาด 4B ทำให้เหมาะสมสำหรับอุปกรณ์ที่มีหน่วยความจำเพียงพอ เช่น M2 Max ผู้เชี่ยวชาญของโมเดลนี้มุ่งเน้นที่ไวยากรณ์ โดยยังมีพื้นที่สำหรับการปรับปรุงในการเลือกผู้เชี่ยวชาญ และขณะนี้มีให้ทดสอบแล้ว แม้ว่าผู้ใช้บางรายจะพบปัญหาเกี่ยวกับแพลตฟอร์ม