Nhảy tới nội dung

2024-10-11

$2 H100s: Cách bong bóng cho thuê GPU vỡ tung

  • Theo thị trường GPU đã trải qua một sự giảm giá đáng kể, với các GPU H100 giảm từ $8/giờ xuống dưới $2/giờ do cung vượt cầu và sự thay đổi trong động lực nhu cầu. - Các yếu tố góp phần vào sự thay đổi này bao gồm việc bán lại tính toán đã được đặt trước, tinh chỉnh mô hình mở, và sự giảm bớt các công ty mô hình nền tảng mới, làm cho việc thuê GPU trở nên có lợi hơn so với việc mua. - Sự xuất hiện của các mô hình trọng lượng mở và các lựa chọn thay thế phải chăng hơn, như GPU của AMD và Intel, đang ảnh hưởng đến thị trường, với sự nhấn mạnh ngày càng tăng vào suy luận AI và tinh chỉnh, được hỗ trợ bởi các nền tảng như Featherless.AI cung cấp các giải pháp AI tiết kiệm chi phí.

phản ứng

  • Thị trường cho thuê GPU đã chứng kiến sự giảm giá đáng kể đối với GPU H100, từ 8 USD/giờ xuống còn 2 USD/giờ, do nguồn cung dư thừa và nhu cầu giảm từ các công ty mô hình nền tảng mới.
  • Việc giảm giá này đã làm vỡ bong bóng cho thuê GPU, ảnh hưởng đến các nhà đầu tư đã đầu tư mạnh vào cơ sở hạ tầng GPU.
  • Bài báo khám phá tiềm năng cho một bối cảnh AI dễ tiếp cận hơn với các tùy chọn tính toán rẻ hơn, mặc dù tính bền vững lâu dài của những mức giá thấp này và tương lai của cơ sở hạ tầng AI vẫn chưa chắc chắn.

Xe taxi tự lái Tesla

phản ứng

  • Tesla gần đây đã giới thiệu Robotaxi của mình, nhấn mạnh tầm nhìn về taxi tự hành khác biệt với cách tiếp cận của Waymo, công ty sử dụng phần cứng đắt tiền như LiDAR. Thiết kế của Robotaxi, không có vô lăng, cho thấy một tương lai phụ thuộc vào tự động hóa hoàn toàn, mặc dù nó phải đối mặt với những thách thức về quy định và công nghệ. Công nghệ Tự Lái Hoàn Toàn (FSD) của Tesla là một chủ đề gây tranh cãi, với những người chỉ trích đặt câu hỏi về sự sẵn sàng cho việc lái xe không giám sát và những người ủng hộ lạc quan về tiềm năng của nó.

Bắt đầu vô hiệu hóa các tiện ích mở rộng đã cài đặt vẫn đang sử dụng Manifest V2 trong Chrome ổn định

  • Google đang loại bỏ Manifest V2 cho các tiện ích mở rộng của Chrome, với các cảnh báo và việc vô hiệu hóa các tiện ích mở rộng này bắt đầu trên các kênh chưa ổn định từ ngày 9 tháng 10 năm 2024.
  • Người dùng được khuyến khích chuyển sang các lựa chọn thay thế Manifest V3, với các doanh nghiệp có thời hạn đến tháng 6 năm 2025 để hoàn tất việc chuyển đổi bằng cách sử dụng chính sách ExtensionManifestV2Availability.
  • Quá trình loại bỏ dần bắt đầu vào ngày 3 tháng 6 năm 2024, và Cửa hàng Chrome Web đã không chấp nhận các tiện ích mở rộng Manifest V2 mới kể từ tháng 6 năm 2022 đối với các tiện ích riêng tư và tháng 1 năm 2022 đối với các tiện ích công khai hoặc không được liệt kê.

phản ứng

  • Chrome đang chuyển từ tiện ích mở rộng Manifest V2 sang Manifest V3, ảnh hưởng đến các trình chặn quảng cáo như uBlock Origin bằng cách hạn chế khả năng của chúng. Trong khi Chrome thực hiện sự chuyển đổi này, các trình duyệt như Firefox, Vivaldi và Brave dự định tiếp tục hỗ trợ Manifest V2 trong thời gian hiện tại. Sự thay đổi này đã thúc đẩy các cuộc thảo luận về quyền kiểm soát và quyền riêng tư của người dùng, với một số người dùng đang cân nhắc chuyển sang các trình duyệt thay thế để duy trì các tính năng chặn quảng cáo hiệu quả.

A Lisp compiler sang RISC-V được viết bằng Lisp

  • uLisp là một phiên bản của ngôn ngữ lập trình Lisp được thiết kế cho các vi điều khiển, hỗ trợ các nền tảng như Arduino, Raspberry Pi và ESP32. Nó bao gồm các tính năng như gỡ lỗi, giao diện thẻ SD và giao diện nối tiếp I2C/SPI, với các ví dụ cho các ứng dụng như nhấp nháy đèn LED và ghi dữ liệu. Một tính năng đáng chú ý là trình biên dịch Lisp cho RISC-V, biên dịch các hàm Lisp thành mã máy, hỗ trợ các hàm đệ quy và tối ưu hóa đuôi gọi để cải thiện hiệu suất.

phản ứng

  • Một trình biên dịch Lisp cho RISC-V, được viết bằng Lisp, đang trong quá trình phát triển nhưng thiếu một số thao tác và chức năng để có thể tự biên dịch. Trình biên dịch hỗ trợ các chức năng Lisp cơ bản như car và cdr, nhưng chưa hoàn thiện. uLisp được nhấn mạnh vì sự đơn giản và phù hợp với vi điều khiển, với RISC-V là một nền tảng hấp dẫn cho những người đam mê công nghệ và hacker.

Nobel Hòa bình năm 2024 được trao cho Nihon Hidankyo

  • Theo thông tin, Giải Nobel Hòa bình năm 2024 đã được trao cho Nihon Hidankyo, một tổ chức của những người sống sót sau vụ nổ bom nguyên tử ở Nhật Bản, được biết đến với tên gọi Hibakusha, vì những nỗ lực vận động cho một thế giới không có vũ khí hạt nhân. Hibakusha đã đóng góp đáng kể vào việc thiết lập "cấm kỵ hạt nhân," một chuẩn mực toàn cầu chống lại việc sử dụng vũ khí hạt nhân, thông qua những lời chứng đầy tác động của họ. Sự công nhận này phù hợp với tầm nhìn của Alfred Nobel về việc tôn vinh những nỗ lực có lợi cho nhân loại và tiếp tục truyền cảm hứng cho các thế hệ mới hướng tới giải trừ vũ khí hạt nhân.

phản ứng

  • Theo thông tin, Giải Nobel Hòa bình năm 2024 đã được trao cho Nihon Hidankyo, một tổ chức Nhật Bản vận động chống lại vũ khí hạt nhân, nhấn mạnh mối đe dọa dai dẳng của vũ khí hạt nhân trong bối cảnh căng thẳng toàn cầu. Giải thưởng này là lời nhắc nhở về tác động tàn phá của chiến tranh hạt nhân, như đã được minh chứng qua Hiroshima và Nagasaki, và nhấn mạnh tầm quan trọng của việc giải trừ vũ khí. Cuộc thảo luận về giải thưởng cũng liên quan đến những phức tạp của sự răn đe hạt nhân, luật pháp quốc tế và động lực địa chính trị giữa các cường quốc hạt nhân.

Những lựa chọn thay thế cho WordPress

  • Theo bài viết đã được cập nhật để bao gồm nhiều lựa chọn Hệ thống Quản lý Nội dung (CMS) hơn do sự quan tâm gia tăng, đặc biệt là trong bối cảnh tình hình hiện tại của WordPress. Danh sách này có các tùy chọn CMS có thể tải xuống như Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail và Textpattern, loại trừ các CMS dựa trên API và git. Những điểm đáng chú ý bao gồm Ghost với các tính năng email tích hợp, Kirby với cách tiếp cận dựa trên tệp, và ClassicPress như một nhánh WordPress do cộng đồng dẫn dắt, trong khi một số CMS như Anchor không còn được duy trì.

phản ứng

  • Jekyll trên GitHub Pages được khuyến nghị cho các blog đơn giản sử dụng Markdown, mang lại sự dễ sử dụng mà không cần thiết lập cục bộ và cho phép di chuyển nội dung giữa các nền tảng.
  • Những lựa chọn thay thế cho WordPress để viết blog bao gồm Chyrp Lite, Typecho, Quartz và Logseq, trong khi Drupal, ProcessWire và Wagtail cung cấp sự linh hoạt hơn cho các nhà phát triển.
  • Trình tạo trang tĩnh như Astro và Publii đang trở nên ngày càng phổ biến, và đối với việc lưu trữ hình ảnh, các tùy chọn như S3+Cloudfront hoặc CloudFlare được đề xuất.

Google Play đã gỡ bỏ trò chơi của tôi và không cho tôi biết lý do

  • Tukkun, một nhà phát triển game độc lập, đã làm việc trên "Anti-Idle: Reborn," trò chơi đã được Google và Apple phê duyệt, và đã ở giai đoạn Beta kín trong một tháng. Vào ngày 7 tháng 10 năm 2024, Google đã chấm dứt tài khoản của Tukkun với lý do "vi phạm trước đó" và "Hành vi rủi ro cao," nhưng không cung cấp một giải thích rõ ràng, ảnh hưởng đến công việc và thu nhập của anh. Tình huống này nêu bật một vấn đề rộng lớn hơn khi các nhà phát triển gặp phải việc chấm dứt tài khoản mơ hồ, thúc đẩy lời kêu gọi về sự minh bạch và rõ ràng hơn từ các nền tảng như Google.

phản ứng

  • Google Play đã gỡ bỏ trò chơi của một nhà phát triển mà không có lời giải thích, nhấn mạnh sự kiểm soát đáng kể mà các công ty công nghệ có đối với các nhà phát triển.
  • Những sự cố tương tự đã được báo cáo với Amazon và Google, nơi các tài khoản hoặc ứng dụng bị cấm mà không có lý do rõ ràng hoặc hỗ trợ đầy đủ.
  • Nhà phát triển được khuyến khích đa dạng hóa các nền tảng của họ để giảm thiểu rủi ro, vì tình huống này làm nổi bật những lo ngại rộng hơn về dịch vụ khách hàng của các tập đoàn công nghệ lớn và rủi ro phụ thuộc khi xây dựng doanh nghiệp trên các nền tảng của họ.

Nurdle Patrol

phản ứng

  • Vào năm 2023, có 221 container vận chuyển bị mất trên biển, một con số nhỏ so với 250 triệu container được vận chuyển hàng năm, nhấn mạnh quy mô của các hoạt động vận chuyển toàn cầu.
  • Viên nhựa, được gọi là nurdles, là chất gây ô nhiễm có thể nhìn thấy trên các bãi biển và có thể phân hủy thành vi nhựa, xâm nhập vào chuỗi thức ăn và gây hại tiềm tàng, mặc dù chúng không phải là nguồn chính của ô nhiễm nhựa biển.
  • Cuộc thảo luận về ô nhiễm nhựa nhấn mạnh sự phức tạp và tác động toàn cầu của nó, bao gồm việc xuất khẩu các vấn đề chất thải từ các nước phát triển sang các nước đang phát triển và khả năng thích ứng của các hệ sinh thái với ô nhiễm nhựa, làm dấy lên lo ngại về việc sử dụng nhựa trong tương lai.

Những bài học ban đầu về hiệu suất CUDA

  • Malte Skarupke thảo luận về kinh nghiệm học CUDA của mình, lưu ý rằng nó về cơ bản là C++ với các tính năng bổ sung cho tính toán song song.
  • Những bài học quan trọng để tối ưu hóa hiệu suất CUDA bao gồm hợp nhất bộ nhớ, hiểu các loại bộ nhớ khác nhau, và tối đa hóa tính song song bằng cách sử dụng nhiều luồng và tách các tác vụ thành các kernel khác nhau.
  • Skarupke nhấn mạnh rằng viết CUDA giống như giải một câu đố, nơi mà trọng tâm chính nên là chạy các tác vụ song song trước khi tối ưu hóa cho tốc độ.

phản ứng

  • Cuộc thảo luận tập trung vào việc tối ưu hóa mã CUDA cho hiệu suất GPU, cụ thể là cho một bộ kích hoạt thí nghiệm LHC (Máy Va Chạm Hadron Lớn), bằng cách quản lý các thanh ghi, bộ nhớ chia sẻ và các khối luồng.
  • Điều này nhấn mạnh sự đánh đổi giữa mức độ chiếm dụng (số lượng luồng hoạt động), việc sử dụng thanh ghi và độ trễ bộ nhớ, làm nổi bật sự phát triển của các ràng buộc lập trình trong CUDA.
  • Cuộc trò chuyện so sánh hiệu suất của GPU và CPU, lưu ý sự khác biệt về tiêu thụ điện năng và khả năng tính toán, và nhấn mạnh tầm quan trọng của việc cân bằng giữa khả năng sử dụng và hiệu suất cho các tiến bộ phần cứng và phần mềm trong tương lai.

FBI đã tạo ra một đồng xu để điều tra các kế hoạch bơm và xả tiền điện tử

  • Theo FBI, một loại tiền điện tử dựa trên Ethereum, NexFundAI, đã được phát triển để điều tra và phơi bày các kế hoạch bơm và xả tiền điện tử, dẫn đến các hành động pháp lý đáng kể. Các cáo buộc đã được đưa ra đối với 18 cá nhân và thực thể vì gian lận và thao túng thị trường, với Ủy ban Chứng khoán và Giao dịch nhắm vào ba nhà tạo lập thị trường và chín người khác vì thổi phồng giá tài sản tiền điện tử. Bộ Tư pháp đã thành công trong việc thu hồi 25 triệu đô la từ các khoản thu gian lận, số tiền này sẽ được trả lại cho các nhà đầu tư, nhấn mạnh hiệu quả của hoạt động trong việc chống lại gian lận tiền điện tử.

phản ứng

  • FBI đã phát triển một loại tiền điện tử để điều tra các kế hoạch bơm và xả, đây là những hành vi gian lận làm tăng giá tài sản một cách giả tạo trước khi bán ra.
  • Đề xuất này đã làm dấy lên các cuộc tranh luận về việc gài bẫy và những tác động đạo đức của việc cơ quan thực thi pháp luật tạo ra chứng khoán giả.
  • Cuộc thảo luận mở rộng đến những lo ngại rộng hơn về tính hợp pháp của tiền điện tử và vai trò của chính phủ trong việc điều chỉnh các loại tiền kỹ thuật số.

NotesHub: ứng dụng ghi chú đa nền tảng, dựa trên Markdown

  • Theo ứng dụng có sẵn trên nhiều nền tảng, bao gồm iOS, Android, Windows, Mac, Apple Vision Pro và Web, với phiên bản Web là một ứng dụng web tiến bộ miễn phí hoạt động ngoại tuyến. - Ghi chú có thể được lưu trữ trong các kho Git, với tích hợp tốt nhất với GitHub, và cũng hỗ trợ các tùy chọn tự lưu trữ như Gitea, hệ thống tệp, hoặc iCloud Drive. - Ứng dụng hỗ trợ cú pháp Markdown phong phú với các phần mở rộng để tạo bảng Kanban, bảng trắng dựa trên Excalidraw, và bao gồm các tính năng như ký hiệu nhạc Mermaid và ABC.

phản ứng

  • NotesHub là một ứng dụng ghi chú đa năng dựa trên Markdown, có sẵn trên nhiều nền tảng, bao gồm iOS, Android, Windows, Mac, Apple Vision Pro và Web. Ứng dụng cung cấp phiên bản Progressive Web App miễn phí, trong khi các phiên bản gốc yêu cầu thanh toán một lần, với tích hợp mạnh mẽ để lưu trữ ghi chú trong các kho lưu trữ Git như GitHub, GitLab hoặc Bitbucket. Nó có các tính năng cú pháp Markdown phong phú, bảng Kanban và bảng trắng dựa trên Excalidraw, với người dùng khen ngợi thiết kế sạch sẽ và khả năng hoạt động ngoại tuyến, mặc dù nó không phải là mã nguồn mở và có hỗ trợ hạn chế cho Linux.

Chế độ công tắc người chết mà không phụ thuộc vào cơ sở hạ tầng của bạn

  • Một dự án Go mới, Deadcheck, đã được phát triển để hoạt động như một công tắc của người chết mà không cần dựa vào các công việc cron, bộ đếm thời gian hoặc cơ sở dữ liệu. Deadcheck tích hợp với PagerDuty, một nền tảng quản lý sự cố phổ biến, để giữ các sự cố ở trạng thái tạm dừng cho đến khi một lần kiểm tra bị bỏ lỡ, lúc đó nó sẽ kích hoạt một cảnh báo. Dự án này nổi bật với cách tiếp cận sáng tạo trong việc quản lý cảnh báo và sự cố mà không cần phụ thuộc vào lập lịch truyền thống hoặc cơ sở dữ liệu.

phản ứng

  • Deadcheck là một dự án Go được thiết kế như một công tắc của người chết, loại bỏ nhu cầu sử dụng cron jobs hoặc cơ sở dữ liệu, và tích hợp với PagerDuty để quản lý cảnh báo.
  • Đề án đã khơi dậy các cuộc thảo luận về công tắc của người chết, bao gồm các khía cạnh pháp lý và các giải pháp thay thế như sử dụng luật sư hoặc hệ thống blockchain.
  • Người dùng đã đề xuất các dịch vụ hiện có như Cronitor hoặc OpsGenie cho các chức năng tương tự, và dự án có kế hoạch mở rộng tích hợp ngoài PagerDuty.

Hiểu về Giới hạn của Lý luận Toán học trong Các Mô hình Ngôn ngữ Lớn

  • Bài báo "GSM-Symbolic" của Iman Mirzadeh và cộng sự nghiên cứu khả năng suy luận toán học của các Mô hình Ngôn ngữ Lớn (LLMs) bằng cách sử dụng tiêu chuẩn GSM8K. - Các tác giả giới thiệu GSM-Symbolic, một tiêu chuẩn mới với các mẫu ký hiệu, cho thấy rằng LLMs gặp khó khăn với các biến thể trong giá trị số và các mệnh đề bổ sung trong câu hỏi. - Nghiên cứu gợi ý rằng LLMs có thể tái tạo suy luận từ dữ liệu huấn luyện thay vì thực hiện suy luận logic thực sự, nhấn mạnh những hạn chế của chúng trong suy luận toán học.

phản ứng

  • Những Mô hình Ngôn ngữ Lớn (LLMs) gặp khó khăn trong việc suy luận toán học, đặc biệt khi các vấn đề bao gồm thông tin không liên quan, điều này ảnh hưởng đến hiệu suất của chúng. Hạn chế này nhấn mạnh sự phụ thuộc của LLMs vào nhận diện mẫu hơn là suy luận logic, khiến chúng kém hiệu quả hơn trong các tình huống thực tế với các chi tiết không cần thiết. Mặc dù có những tiến bộ, LLMs vẫn gặp khó khăn trong việc phân biệt thông tin quan trọng với nhiễu, một kỹ năng quan trọng cần thiết cho các ứng dụng thực tiễn.

ARIA: Một Mô Hình Hỗn Hợp Chuyên Gia Bản Địa Đa Phương Thức Mở

  • Aria là một mô hình AI bản địa đa phương thức mở, tích hợp thông tin thực tế đa dạng để có sự hiểu biết toàn diện, vượt trội hơn các mô hình như Pixtral-12B và Llama3.2-11B về hiệu suất. Đây là một mô hình hỗn hợp chuyên gia với 3,9 tỷ và 3,5 tỷ tham số được kích hoạt cho mỗi token hình ảnh và văn bản, tương ứng, nâng cao khả năng ngôn ngữ và đa phương thức của nó. Trọng số và mã nguồn của mô hình được mở nguồn, tạo điều kiện thuận lợi cho việc áp dụng và điều chỉnh dễ dàng bởi các nhà phát triển và nhà nghiên cứu.

phản ứng

  • ARIA là một mô hình Mixture-of-Experts (MoE) đa phương thức mới vượt trội hơn Pixtral-12B và Llama3.2-11B về hiệu suất và tốc độ suy luận bằng cách sử dụng hiệu quả các tham số hoạt động. Mặc dù có mức sử dụng bộ nhớ tương tự như một mô hình 25B, ARIA hoạt động như một mô hình 10B và hoạt động nhanh như một mô hình 4B, làm cho nó phù hợp với các thiết bị có bộ nhớ đủ, chẳng hạn như M2 Max. Các chuyên gia của mô hình tập trung vào cú pháp, với không gian để cải thiện trong việc lựa chọn chuyên gia, và hiện tại nó có sẵn để thử nghiệm, mặc dù một số người dùng đã gặp phải vấn đề về nền tảng.