2024-07-23

Mã nguồn mở AI là con đường phía trước

Linux mã nguồn mở đã trở thành tiêu chuẩn của ngành cho điện toán đám mây và thiết bị di động nhờ khả năng tùy chỉnh, chi phí hợp lý và các tính năng tiên tiến, tương tự như quỹ đạo dự kiến của AI.
Meta đã phát hành Llama 3.1 405B, mô hình AI mã nguồn mở đầu tiên ở cấp độ tiên phong, cùng với các mô hình cải tiến 70B và 8B, nhấn mạnh vào hiệu suất/chi phí tốt hơn và khả năng phù hợp cho việc tinh chỉnh.
Meta hợp tác với các công ty như Amazon, Databricks và NVIDIA để hỗ trợ các nhà phát triển, nhằm biến AI mã nguồn mở thành tiêu chuẩn của ngành, thúc đẩy tính minh bạch, an ninh và tăng trưởng kinh tế.

phản ứng

Meta đã ra mắt Llama 3.1, một mô hình AI mã nguồn mở, với mô hình 405 tỷ tham số và các mô hình nâng cao 70 tỷ và 8 tỷ tham số.
Việc phát hành này được coi là một động thái chiến lược nhằm thách thức các đối thủ như OpenAI, Google và Microsoft bằng cách cung cấp các mô hình AI tiên tiến miễn phí, với các hạn chế đối với các công ty có hơn 700 triệu người dùng.
Những người chỉ trích cho rằng nếu không có quyền truy cập vào dữ liệu đào tạo và cơ sở hạ tầng, các mô hình này giống phần mềm miễn phí hơn là mã nguồn mở thực sự, gây ra tranh luận về ý định thực sự của Meta và những tác động rộng lớn hơn.

Kawaii – Một chiếc Nintendo Wii kích thước móc khóa

phản ứng

Đề án "Thundervolt" bao gồm việc sửa đổi một chiếc Nintendo Wii bằng cách cắt giảm PCB (Bảng mạch in) để chỉ giữ lại các thành phần thiết yếu như DRAM (Bộ nhớ truy cập ngẫu nhiên động) và bộ vi xử lý, và thêm một bảng DCDC (Chuyển đổi dòng điện một chiều sang dòng điện một chiều) bên ngoài để cung cấp năng lượng.
Đề án nhằm tạo ra một chiếc Wii có kích thước bằng móc khóa, được đặt tên là "Kawaii," nhỏ hơn các phiên bản thu nhỏ khác như GC Nano, nhưng vẫn cần một đế cắm để hoạt động đầy đủ, bao gồm cả đầu vào nguồn và kết nối bộ điều khiển.
Đề án này làm nổi bật sự quan tâm và đổi mới liên tục trong lĩnh vực trò chơi điện tử cổ điển và thu nhỏ máy chơi game, thể hiện sự cống hiến của cộng đồng trong việc bảo tồn và nâng cao phần cứng trò chơi cổ điển.

Timeshift: Công cụ Khôi phục Hệ thống cho Linux

Timeshift cho Linux là một công cụ sao lưu hệ thống tương tự như Windows System Restore và Mac OS Time Machine, tập trung vào các tệp hệ thống và cài đặt.
Phần mềm này hỗ trợ hai chế độ: RSYNC (sử dụng rsync và hard-links) và BTRFS (sử dụng các tính năng của hệ thống tệp BTRFS), với chế độ sau yêu cầu một bố cục subvolume cụ thể.
Được phát triển bởi Tony George và hiện là một phần của dự án Xapp bởi Linux Mint, Timeshift cung cấp các tính năng như nhiều mức ảnh chụp, khôi phục liên phân phối, và các móc sau khôi phục, với hướng dẫn cài đặt có sẵn cho nhiều bản phân phối Linux khác nhau.

phản ứng

Timeshift là một công cụ khôi phục hệ thống cho Linux, tương tự như Time Machine của macOS và System Restore của Windows, cho phép người dùng tạo các bản chụp hệ thống tập tin bằng cách sử dụng rsync và hardlinks.
Người dùng thảo luận về các giải pháp và cấu hình sao lưu khác nhau, bao gồm restic, rclone, ZFS, BTRFS và ảnh chụp nhanh LVM, nhấn mạnh tầm quan trọng của ảnh chụp nhanh nguyên tử để đảm bảo tính nhất quán của cơ sở dữ liệu và sao lưu đáng tin cậy.
Cuộc trò chuyện nhấn mạnh sự cần thiết của các chiến lược sao lưu mạnh mẽ, so sánh các công cụ như restic, Borg và kopia, và thảo luận về ưu và nhược điểm của các hệ thống tệp và phương pháp chụp nhanh khác nhau.

Tháng 7 năm 2024 Cập nhật về Báo cáo Bất ổn trên CPU Intel Core Thế hệ 13/14 cho Máy tính Để bàn

Intel đã xác định được sự không ổn định trong các bộ vi xử lý máy tính để bàn thế hệ thứ 13 và 14 của mình do điện áp hoạt động tăng cao từ một thuật toán mã vi.
Intel dự kiến sẽ phát hành bản vá vi mã để giải quyết vấn đề này vào giữa tháng Tám, và khuyến cáo các khách hàng bị ảnh hưởng liên hệ với bộ phận hỗ trợ để được trợ giúp.
Người dùng đã bày tỏ lo ngại về khả năng hư hại CPU lâu dài, sự cần thiết của các bản cập nhật BIOS, và đã báo cáo các vấn đề RMA (Ủy quyền Trả lại Hàng hóa) trong khi tìm kiếm hướng dẫn về cách quản lý sự không ổn định cho đến khi bản vá được phát hành.

phản ứng

Thông báo cập nhật tháng 7 năm 2024 của Intel cho thấy một vấn đề về mã vi điều khiển trong các CPU máy tính để bàn thế hệ thứ 13/14 gây ra yêu cầu điện áp không chính xác, mặc dù một số người dùng nghi ngờ có lỗi phần cứng.
Những lo ngại nảy sinh do sự chậm trễ của Intel trong việc giải quyết vấn đề và các báo cáo về việc các CPU không bị lỗi được xuất xưởng mà không có mã vi cập nhật, có thể dẫn đến sự suy giảm CPU lâu dài.
Intel dự định phát hành một bản vá vi mã, nhưng hiệu quả và tác động đến hiệu suất của nó vẫn chưa chắc chắn, với người dùng báo cáo những trải nghiệm khác nhau về sự ổn định của CPU.

Thiết Kế Cơ Sở Dữ Liệu cho Google Calendar: Một Hướng Dẫn

Buổi hướng dẫn của Alexey Makhotkin cung cấp một hướng dẫn toàn diện về thiết kế bảng cơ sở dữ liệu cho một bản sao Google Calendar, theo phương pháp từ cuốn sách sắp ra mắt “Thiết kế Cơ sở Dữ liệu sử dụng Mô hình Tối thiểu.”
Bài viết bao quát mô hình logic một cách chi tiết, hướng dẫn cách xử lý các sự kiện cả ngày, sự kiện dựa trên thời gian và các sự kiện lặp lại, sau đó chuyển sang việc tạo các bảng SQL vật lý.
Khóa hướng dẫn này nhằm vào những độc giả có hiểu biết chung về cơ sở dữ liệu, giúp họ chuyển từ các ý tưởng khái niệm sang các định nghĩa bảng cơ sở dữ liệu hoàn chỉnh, và bao gồm các bước thực tiễn để triển khai thiết kế.

phản ứng

Cuộc thảo luận về thiết kế cơ sở dữ liệu của Google Calendar đề xuất tối ưu hóa trình phân tích iCalendar để quét sự kiện nhanh thay vì tạo ra một lược đồ phức tạp.
Những lo ngại đã được nêu ra về nhu cầu tìm kiếm phạm vi giống như SQL và các truy vấn cụ thể của người dùng, mà các cơ sở dữ liệu truyền thống xử lý tốt.
Cuộc tranh luận bao gồm các thách thức như múi giờ, giờ tiết kiệm ánh sáng ban ngày và các sự kiện định kỳ, với sự đồng thuận rằng khả năng quản lý mối quan hệ và truy vấn của SQL làm cho nó phù hợp với các ứng dụng lịch.

Vẻ Đẹp của Bảng Mã ASCII

ASCII table, được chuẩn hóa vào năm 1963, gán ý nghĩa cho 100 trong số 128 mã nhị phân 7-bit có thể có và vẫn còn phù hợp cho đến ngày nay, đặc biệt là với mã hóa UTF-8 tương thích ngược.
Trong bảng bao gồm các mã điều khiển, các ký tự có thể in được, và tuân theo các mẫu nhị phân cụ thể, với ký tự khoảng trắng là ký tự có thể in được đầu tiên cho mục đích sắp xếp.
Thiết kế của ASCII là hợp lý và thẩm mỹ, làm cho nó dễ hiểu và dễ học đối với con người, phản ánh tầm quan trọng lịch sử và logic tinh tế của nó.

phản ứng

Đoạn viết thảo luận về sự thanh lịch và tính hữu dụng của bảng mã ASCII, một tiêu chuẩn mã hóa ký tự được sử dụng trong tin học.
Điều này nêu bật cách người dùng có thể truy cập bảng ASCII trên hệ thống Linux thông qua lệnh man ascii, điều này hữu ích cho các mã thoát shell và biểu thức chính quy (regex).
Cuộc trò chuyện bao gồm bối cảnh lịch sử và những giai thoại cá nhân về việc học các công nghệ khác nhau thông qua manpages, nhấn mạnh tầm quan trọng lâu dài của bảng mã ASCII trong lĩnh vực máy tính.

Liệu có thể kiếm được mức lương FAANG mà không làm việc ở đó không?

Khoảng cách lương giữa các công ty FAANG (Facebook, Amazon, Apple, Netflix, Google) và các công ty không thuộc FAANG là đáng kể, với các kỹ sư của FAANG nhận được các gói bồi thường cao hơn đáng kể.
Một Kỹ sư Nhân viên tại một công ty khởi nghiệp điển hình có thể kiếm được mức lương cơ bản là 250 nghìn đô la cộng với tiền thưởng từ 10-20%, trong khi một Kỹ sư Nhân viên tại FAANG có thể nhận được mức lương cơ bản tương tự cộng với 1 triệu đô la cổ phiếu trong bốn năm.
Đoạn bài đặt câu hỏi liệu các cá nhân ngoài FAANG và các ngân hàng lớn/công ty giao dịch tần suất cao (HFT) có kiếm được số tiền tương đương hay không, và tìm cách xác định họ là ai và vai trò của họ.

phản ứng

Earning FAANG-level salaries outside of FAANG companies is possible but rare, often involving niche or high-stress roles.
Những lựa chọn thay thế có thu nhập cao bao gồm các quỹ đầu cơ, các công ty giao dịch tần suất cao, tư vấn chuyên biệt, các công ty phần mềm ngách, chuyên môn về hệ thống cũ, và khởi nghiệp.
Những vai trò này thường đi kèm với căng thẳng cao, cạnh tranh khốc liệt, hoặc rủi ro và nỗ lực đáng kể, khiến chúng ít phổ biến và đơn giản hơn so với các công việc tại FAANG.

Llama 3.1

Llama 3.1 là một mô hình AI mã nguồn mở có sẵn trong ba phiên bản: 8B, 70B và 405B, phục vụ cho các nhu cầu về hiệu suất và chi phí khác nhau.
Chúng hỗ trợ các trường hợp sử dụng nâng cao, bao gồm trợ lý lập trình, tác nhân đa ngôn ngữ và lý luận phức tạp, với khả năng suy luận thời gian thực và theo lô, tinh chỉnh và tạo dữ liệu tổng hợp.
Model này đã được đánh giá trên hơn 150 bộ dữ liệu, cho thấy hiệu suất cao trong các tiêu chí chung, mã, toán học, lý luận, sử dụng công cụ và các tiêu chuẩn đa ngôn ngữ.

phản ứng

Llama 3.1, một mô hình AI mã nguồn mở của Meta, đang thể hiện hiệu suất cạnh tranh so với các mô hình mã nguồn đóng như GPT-4.
Model 405B cho thấy những cải tiến đáng kể về điểm chuẩn nhưng không thực tế cho việc sử dụng tại nhà nếu không có hỗ trợ đám mây, làm nổi bật những thách thức trong việc chạy các mô hình lớn tại chỗ.
Việc Meta phát hành các mô hình mở mạnh mẽ nhằm làm gián đoạn cảnh quan cạnh tranh, khơi dậy sự quan tâm đến các yêu cầu phần cứng, giải pháp lượng tử hóa và những tác động rộng lớn hơn đối với sự phát triển và khả năng tiếp cận AI.

Người Trộm Nút

Button Stealer là một tiện ích mở rộng của Chrome tự động loại bỏ một nút khỏi mọi trang web bạn truy cập.
Tiện ích mở rộng này được thiết kế để mang lại niềm vui và hoàn toàn miễn phí sử dụng, không có công dụng thực tiễn.
Điều này đảm bảo quyền riêng tư của dữ liệu người dùng bằng cách hoạt động cục bộ trên thiết bị của người dùng.

phản ứng

Button Stealer, một tiện ích mở rộng của Chrome, gây lo ngại về bảo mật do các quyền rộng rãi của nó, có thể cho phép nó thu thập dữ liệu từ bất kỳ trang web nào.
Người dùng đề xuất xem xét mã trên GitHub và cài đặt nó cục bộ để tránh các bản cập nhật có thể gây hại, trong khi những người khác cho rằng các tiện ích mở rộng rủi ro như vậy không nên có trong cửa hàng Chrome.
Cuộc thảo luận nhấn mạnh sự cần thiết của các quyền cụ thể hơn và các thực hành bảo mật được cải thiện cho các tiện ích mở rộng trình duyệt.

Re: Mọi người ngoài đời có biết bạn có một blog không?

Người tác giả thảo luận về ý nghĩa cá nhân của việc duy trì một blog trong gần hai mươi năm, mặc dù không nhận được sự quan tâm từ những người trong cuộc sống thực (IRL).
Blog đóng vai trò như một hình thức tự thể hiện và tự do, đối lập với áp lực của mạng xã hội và các công ty công nghệ lớn.
Phản hồi từ độc giả nêu bật các quan điểm khác nhau, bao gồm lợi ích của việc viết blog để làm rõ cá nhân, lo ngại về việc khai thác AI, và khuyến khích viết mà không cần phân tích.

phản ứng

Trang web cá nhân mang lại sự linh hoạt và tinh tế mà không có áp lực phải cập nhật thường xuyên, không giống như blog có thể khiến người ta cảm thấy lười biếng và không thân thiện.
Blog có thể hữu ích cho các nhà sử học và chia sẻ suy nghĩ, nhưng các trang cá nhân được ưa chuộng hơn vì tính tổ chức và tiềm năng sáng tạo của chúng.
Vài cá nhân sử dụng bút danh trên các trang web cá nhân để tránh những hậu quả nghề nghiệp, nhấn mạnh tính cá nhân của những nền tảng này.

Wiz rút lui khỏi thỏa thuận trị giá 23 tỷ USD với Google

Wiz đã quyết định từ bỏ thỏa thuận mua lại trị giá 23 tỷ đô la với Google và sẽ theo đuổi việc phát hành cổ phiếu lần đầu ra công chúng (IPO) thay vào đó, theo thông báo của CEO Assaf Rappaport.
Quyết định này bị ảnh hưởng bởi các mối lo ngại về chống độc quyền và nhà đầu tư, với mục tiêu của Wiz là đạt được 1 tỷ đô la doanh thu định kỳ hàng năm.
Được thành lập vào năm 2020, Wiz đã nhanh chóng phát triển, đạt doanh thu định kỳ hàng năm là 350 triệu đô la vào năm ngoái, và cung cấp các sản phẩm bảo mật đám mây.

phản ứng

Wiz đã rút khỏi thỏa thuận trị giá 23 tỷ đô la với Google, có thể do Google đang đánh giá lại thỏa thuận sau khi xem xét dữ liệu nội bộ.
Wiz tuyên bố họ rút lui vì tin rằng định giá của họ cao hơn, mặc dù có sự hoài nghi về định giá cao của họ, được báo cáo là hơn 60 lần Doanh thu Định kỳ Hàng năm (ARR) của họ.
Việc thỏa thuận đổ vỡ đặt ra câu hỏi về giá trị thực sự và tương lai của Wiz, mặc dù họ đã tăng trưởng nhanh chóng đạt 100 triệu USD ARR kể từ khi thành lập vào năm 2020.

Ý định chấm dứt dịch vụ OCSP

Let’s Encrypt sẽ ngừng hỗ trợ Giao thức Trạng thái Chứng chỉ Trực tuyến (OCSP) để chuyển sang sử dụng Danh sách Thu hồi Chứng chỉ (CRLs) do các rủi ro về quyền riêng tư và hiệu quả tài nguyên.
Thay đổi này sẽ không ảnh hưởng đến các trang web hoặc khách truy cập nhưng có thể ảnh hưởng đến một số phần mềm không phải trình duyệt; người dùng được khuyên nên đảm bảo phần mềm của họ hoạt động mà không cần URL OCSP.
Quyết định của Diễn đàn CA/Browser khiến OCSP trở thành tùy chọn cho các Tổ chức Chứng nhận (CA) được công nhận công khai, với Microsoft là ngoại lệ duy nhất; một lộ trình cho việc ngừng cung cấp dịch vụ OCSP sẽ được công bố khi Microsoft cũng làm cho nó trở thành tùy chọn.

phản ứng

Let's Encrypt dự định ngừng cung cấp dịch vụ OCSP (Giao thức Trạng thái Chứng chỉ Trực tuyến) do các vấn đề liên quan đến Danh sách Thu hồi Chứng chỉ (CRLs) và sự phức tạp của các hệ thống OCSP.
Đề xuất bao gồm việc sử dụng định dạng nhị phân cho CRL để cải thiện hiệu quả và bắt buộc OCSP stapling để giải quyết các mối lo ngại về quyền riêng tư, mặc dù điều này có thể gây gián đoạn cho nhiều trang web.
Việc chuyển đổi khỏi OCSP có thể ảnh hưởng đến các ứng dụng không phải trình duyệt và các thiết bị nhúng, nhưng người dùng của các máy chủ web tiêu chuẩn như Nginx hoặc Caddy không cần thay đổi ngay lập tức.

Giải mã hệ thống âm thanh Linux (và hơn thế nữa)

Đoạn bài viết cung cấp một cái nhìn tổng quan toàn diện về hệ thống âm thanh Linux, giải thích các khái niệm cơ bản về âm thanh, cách con người cảm nhận âm thanh và xử lý âm thanh kỹ thuật số.
Những thành phần chính của hệ thống âm thanh Linux bao gồm ALSA để kiểm soát phần cứng ở mức thấp, JACK cho âm thanh thời gian thực với độ trễ thấp, và PulseAudio cho quản lý âm thanh ở mức cao hơn, với PipeWire đang nổi lên như một giải pháp thống nhất.
PipeWire được nhấn mạnh như một tùy chọn đa năng tích hợp các tính năng của cả JACK và PulseAudio, có khả năng thay thế chúng trong các bản phân phối Linux tương lai.

phản ứng

Ngăn xếp âm thanh Linux, mặc dù phức tạp, hỗ trợ nhiều loại phần cứng và chức năng đa dạng, bao gồm cả tính năng ghép kênh và mạng.
Pipewire nhằm mục đích hợp nhất ngăn xếp âm thanh Linux, hỗ trợ các API khác nhau và cải thiện PulseAudio, mang lại tính linh hoạt và ổn định cao hơn.
Trong khi một số người dùng gặp khó khăn với các thiết lập nâng cao, nhiều người lại đánh giá cao những cải tiến và tính linh hoạt mà Pipewire mang lại cho âm thanh trên Linux.

Hoa Kỳ công bố số lượng đầu đạn hạt nhân; khôi phục sự minh bạch về hạt nhân

Liên đoàn Các nhà khoa học Mỹ (FAS) ca ngợi Hoa Kỳ vì đã giải mật số lượng đầu đạn hạt nhân của mình, tăng cường tính minh bạch về hạt nhân.
Đến tháng 9 năm 2023, Hoa Kỳ có 3.748 đầu đạn hạt nhân, chỉ có 69 đầu đạn được tháo dỡ trong năm ngoái, con số thấp nhất kể từ năm 1994.
Bản công bố của chính quyền Biden khôi phục tính minh bạch đã bị tạm dừng bởi chính quyền Trump, và FAS khuyến khích các quốc gia hạt nhân khác áp dụng tính minh bạch tương tự để ngăn chặn sự ngờ vực và thông tin sai lệch.

phản ứng

Hoa Kỳ đã tiết lộ số lượng đầu đạn hạt nhân của mình, khôi phục tính minh bạch hạt nhân và khơi dậy các cuộc thảo luận về năng lực sản xuất và tầm quan trọng chiến lược.
Những chủ đề chính bao gồm tốc độ tăng cường sản xuất tiềm năng, tác động của kích thước kho dự trữ đến an toàn toàn cầu và địa chính trị, và những thách thức trong việc bảo trì như lão hóa plutonium và thay thế tritium.
Việc tiết lộ nhằm trấn an các đồng minh và ngăn chặn các đối thủ bằng cách phô trương khả năng hạt nhân đáng kể của Hoa Kỳ.

Lisp trong C#

Sharpl là một trình thông dịch Lisp tùy chỉnh được viết bằng C# với khoảng 4.000 dòng mã và không có phụ thuộc bên ngoài, giúp dễ dàng nhúng vào.
Những tính năng chính bao gồm cặp, mảng, bản đồ, thành phần phương pháp, varargs, giao thức lặp thống nhất, và kiểu số thập phân điểm cố định, cùng với những tính năng khác.
Ngôn ngữ này hỗ trợ các ràng buộc từ vựng và động, tối ưu hóa gọi đuôi để ngăn chặn tràn ngăn xếp, và cung cấp báo cáo lỗi chi tiết với số dòng.

phản ứng

Bộ phát triển có tên codr7 đang làm việc trên một triển khai Lisp bằng C# và đang tìm kiếm sự trợ giúp về tối ưu hóa từ cộng đồng.
Những cải tiến hiệu suất đáng kể đã đạt được nhờ các đề xuất từ cộng đồng, chẳng hạn như thay đổi cách truy cập ArrayStack và sử dụng Span và ReadOnlySpan để cắt dữ liệu.
Đề án không nhằm tuân thủ các tiêu chuẩn mà thay vào đó tập trung vào hiệu suất thực tế và tính khả dụng, với các cuộc thảo luận đang diễn ra về việc tích hợp các tính năng như macro và Fexprs (biểu thức hàm).