Nhảy tới nội dung

2024-09-13

Những ghi chú về các mô hình chuỗi suy nghĩ o1 mới của OpenAI

  • OpenAI đã phát hành hai mô hình mới, o1-preview và o1-mini, có tên mã là "strawberry," cung cấp khả năng suy luận cải tiến thông qua một mẫu gợi ý chuỗi suy nghĩ.
  • Những mô hình này được dành riêng cho các tài khoản cấp 5 (từ $1,000 trở lên trên các khoản tín dụng API) và giới thiệu "token lý luận" được tính phí nhưng không hiển thị trong phản hồi API, gây ra một số sự không hài lòng do thiếu minh bạch.
  • Những mô hình mới có thể xử lý các yêu cầu phức tạp tốt hơn và có sự gia tăng về số lượng token đầu ra, mở rộng các nhiệm vụ tiềm năng mà các mô hình ngôn ngữ lớn (LLMs) có thể giải quyết.

phản ứng

  • Những mô hình chuỗi suy nghĩ o1 mới của OpenAI vẫn tạo ra những ảo giác, chẳng hạn như các thư viện và hàm không tồn tại, và thường cung cấp các thông tin sai lệch.
  • Người dùng nhận thấy rằng mặc dù khả năng lập luận đã được cải thiện, các mô hình vẫn chưa thể xác minh độ chính xác thực tế của các kết quả đầu ra, đòi hỏi người dùng phải kiểm tra lại.
  • Một số người dùng so sánh các mô hình với những thực tập sinh thông minh nhưng ngây thơ, cho rằng chúng có thể hữu ích với sự hướng dẫn đúng đắn, mặc dù chúng thiếu khả năng đặt câu hỏi làm rõ hoặc thừa nhận sự không chắc chắn, ảnh hưởng đến độ tin cậy của chúng.

Những nhà điều tra dữ liệu phát hiện hành vi sai trái trong nghiên cứu được xóa tội phỉ báng

  • Một tòa án đã tuyên bố các nhà nghiên cứu Data Colada không phạm tội phỉ báng khi xác định dữ liệu bị thao túng trong một cuộc điều tra của Trường Kinh doanh Harvard.
  • Harvard vẫn sẽ phải đối mặt với phiên tòa về cách xử lý vụ việc, mặc dù đã xác nhận hành vi sai trái của giáo sư Francesca Gino, người đang trong thời gian nghỉ hành chính và có thể mất chức vụ.
  • Toà án đã phán quyết rằng những kết luận có bằng chứng hỗ trợ không phải là phỉ báng, hoàn toàn minh oan cho nhóm Data Colada nhờ vào cách tiếp cận thận trọng và dựa trên bằng chứng của họ.

phản ứng

  • Dữ liệu điều tra viên bị cáo buộc phỉ báng vì xác định hành vi sai trái trong nghiên cứu đã được minh oan, với vụ án bị bác bỏ trước khi tiến hành khám phá.
  • Toà án đã phán quyết rằng những kết luận có bằng chứng về dữ liệu giả mạo không cấu thành tội phỉ báng, ủng hộ tính toàn vẹn khoa học.
  • Những bị cáo đã quyên góp được hơn 300 nghìn đô la trên GoFundMe cho việc bào chữa pháp lý của họ, nhấn mạnh chi phí cao và gánh nặng tinh thần của các vụ kiện phỉ báng ở Mỹ.

Boeing công nhân bỏ phiếu đình công

  • Hàng chục nghìn công nhân Boeing đã bỏ phiếu áp đảo để đình công sau khi từ chối một đề nghị hợp đồng, với 96% sự ủng hộ từ Hiệp hội Công nhân Cơ khí và Hàng không Vũ trụ Quốc tế Khu vực 751.
  • Cuộc đình công, bắt đầu bên ngoài các nhà máy của Boeing ở bang Washington, có thể khiến công ty thiệt hại ước tính 1 tỷ đô la mỗi tuần và làm gián đoạn quá trình phục hồi từ những thách thức về tài chính và an toàn.
  • Cho dù đã đề xuất tăng lương 25% trong bốn năm và cải thiện phúc lợi, thỏa thuận vẫn không đáp ứng được các yêu cầu khác của công đoàn; Boeing sẵn sàng quay lại bàn đàm phán, và chính quyền Biden đang theo dõi tình hình.

phản ứng

  • Boeing công nhân đã bỏ phiếu đình công, với 96% từ chối một thỏa thuận đề xuất bao gồm một mức tăng lương đáng kể.
  • Liên đoàn thợ máy đang yêu cầu tăng lương, cải thiện điều kiện làm việc, và yêu cầu Boeing 'ngừng vi phạm pháp luật.'
  • Cuộc đình công nhấn mạnh sự bất mãn rộng rãi hơn với ban quản lý của Boeing, bị chỉ trích vì ưu tiên lợi nhuận hơn chất lượng kỹ thuật và an toàn, góp phần vào các vấn đề như các vụ tai nạn 737 Max.

FDA cho phép phần mềm trợ thính không cần kê đơn đầu tiên

phản ứng

  • FDA đã phê duyệt phần mềm trợ thính không cần kê đơn đầu tiên, cho phép sử dụng AirPods như thiết bị trợ thính, có thể giảm bớt kỳ thị và tăng cường khả năng tiếp cận.
  • Việc phê duyệt này được kỳ vọng sẽ giảm chi phí và khuyến khích nhiều người hơn giải quyết vấn đề mất thính lực của họ, mặc dù vẫn còn những lo ngại về tuổi thọ pin và nhận thức xã hội.
  • Người dùng đã báo cáo những trải nghiệm tích cực với các tính năng hỗ trợ tiếp cận của máy trợ thính và AirPods, đánh dấu một bước tiến quan trọng trong việc làm cho máy trợ thính trở nên phải chăng hơn và được chấp nhận rộng rãi hơn.

Toàn bộ nhân viên của nhà phát hành trò chơi Annapurna Interactive được cho là đã từ chức

  • Toàn bộ nhân viên của Annapurna Interactive, bao gồm cả cựu chủ tịch Nathan Gary, đã từ chức sau một nỗ lực không thành công để tách công ty thành một thực thể độc lập.
  • Những trò chơi và dự án hiện có của Annapurna Interactive sẽ vẫn thuộc công ty, với Hector Sanchez vừa được bổ nhiệm làm chủ tịch của bộ phận tương tác và truyền thông mới.
  • Annapurna dự định tích hợp các hoạt động trò chơi của mình với các bộ phận phim, truyền hình và sân khấu, tiếp tục phát hành các trò chơi như Lorelei and the Laser Eyes và Open Roads, với các tựa game sắp ra mắt như Blade Runner 2033: Labyrinth.

phản ứng

  • Toàn bộ nhân viên của Annapurna Interactive, một nhà phát hành trò chơi, đã từ chức do các cuộc đàm phán thất bại với công ty mẹ của họ, Annapurna Pictures, về việc tích hợp tài chính.
  • Nhân viên và các giám đốc điều hành đã chọn tách ra để duy trì quyền kiểm soát đối với hướng sáng tạo của họ, đặc biệt là sau thành công của các trò chơi như "Outer Wilds" và "Stray."
  • Cuộc từ chức hàng loạt này làm nổi bật sự căng thẳng giữa độc lập sáng tạo và áp lực tài chính trong ngành công nghiệp trò chơi.

Khởi nghiệp của bạn có cần cơ sở hạ tầng đám mây phức tạp không?

  • Peter Levels ủng hộ việc sử dụng hạ tầng đơn giản hơn, sử dụng máy chủ đơn thay vì các thiết lập đám mây phức tạp, để tập trung vào sự phù hợp giữa sản phẩm và thị trường, như đã thảo luận trên Podcast của Lex Friedman.
  • Hai nghiên cứu điển hình nêu bật những cạm bẫy của các thiết lập quá phức tạp: một với các hàm Lambda quá nhiều và một với các dịch vụ vi mô không cần thiết, cả hai đều làm giảm sự phát triển tính năng.
  • Máy chủ hiện đại và các công cụ như Docker Compose có thể cung cấp các giải pháp mạnh mẽ, dễ quản lý và tiết kiệm chi phí, cho phép các nhóm nhỏ tập trung vào việc xây dựng các sản phẩm tuyệt vời thay vì quản lý cơ sở hạ tầng phức tạp.

phản ứng

  • Những công ty khởi nghiệp thường áp dụng cơ sở hạ tầng đám mây phức tạp như Kubernetes để mở rộng quy mô, nhưng điều này có thể dẫn đến chất lượng kém và chi phí cao do các quyết định chưa chín chắn của đội ngũ.
  • Một số chuyên gia có kinh nghiệm cho rằng các thiết lập đơn giản hơn, dễ tái tạo hơn bằng cách sử dụng các công cụ như Puppet và các hệ thống LTS (Hỗ trợ Dài hạn) có thể hiệu quả và tiết kiệm chi phí hơn.
  • Cuộc tranh luận làm nổi bật những đánh đổi giữa các phương pháp hiện đại dựa trên đám mây và các phương pháp truyền thống, mang tính quyết định trong việc quản lý cơ sở hạ tầng.

Chuyển SBCL sang Nintendo Switch

  • Charles Zhang và Shinmera đã làm việc trong hai năm để chuyển đổi công cụ trò chơi Trial sang Nintendo Switch, tập trung vào việc điều chỉnh runtime Common Lisp.
  • Mặc dù đã biên dịch và thực thi thành công mã Lisp trên Switch, các vấn đề chưa được giải quyết bao gồm thu gom rác và đầu ra âm thanh, với dự án tiêu tốn khoảng 17.000 đô la.
  • Chip ARM64 Cortex-A57 và hỗ trợ OpenGL của Switch đã làm cho việc chuyển đổi trở nên khả thi, nhưng vẫn còn những thách thức, chẳng hạn như giao tiếp với hệ điều hành độc quyền của Switch và tối ưu hóa biên dịch CLOS.

phản ứng

  • SBCL (Steel Bank Common Lisp) đang được chuyển sang Nintendo Switch, điều này có ý nghĩa quan trọng đối với phát triển game bằng Common Lisp nhờ vào khả năng đánh giá mã tương tác và chu kỳ phát triển nhanh chóng.
  • Đề án được dẫn dắt bởi Shinmera, người đang xử lý tính di động và kiến trúc xây dựng, nhấn mạnh những thách thức kỹ thuật và lợi ích tiềm năng của việc chạy SBCL trên phần cứng trò chơi chuyên dụng.
  • Việc sử dụng bộ công cụ phát triển phần mềm chính thức của Nintendo (SDK) là cần thiết để phát hành trò chơi trên Switch, vì các bộ công cụ phát triển phần mềm tự chế không được hỗ trợ cho các bản phát hành trên máy chơi game bán lẻ.

Chủ sở hữu của Nebula là ai?

  • Nebula là một dịch vụ phát trực tuyến video theo yêu cầu tập trung vào nội dung giáo dục, được xây dựng bởi những người sáng tạo nội dung nhưng không thực sự thuộc sở hữu của họ.
  • Standard Broadcast sở hữu 83,125% của Nebula, CuriosityStream sở hữu 16,875%, và các nhà sáng tạo trực tiếp sở hữu 0%, mặc dù họ nhận được 50% lợi nhuận và tiền thu được từ việc bán.
  • Những người sáng tạo có "cổ phần bóng," nghĩa là họ được đền bù như những người sở hữu mà không nắm giữ cổ phiếu thực sự, đặt ra câu hỏi về sự phù hợp của nền tảng với các giá trị của những người sáng tạo.

phản ứng

  • Nebula thuộc sở hữu của Standard Broadcast LLC, với 44 nhà sáng tạo có cổ phần ảo thay vì sở hữu trực tiếp để tránh các vấn đề về hậu cần và thuế.
  • Nếu Nebula được bán, các nhà sáng tạo sẽ nhận được 50% số tiền thu được, nhưng một số người cho rằng cấu trúc này thiếu minh bạch và quyền sở hữu hợp tác thực sự.
  • Những người chỉ trích cho rằng việc tiếp thị là gây hiểu lầm vì các nhà sáng tạo không có quyền sở hữu trực tiếp hoặc kiểm soát Nebula.

FlowTracker – Theo dõi dữ liệu chảy qua các chương trình Java

  • FlowTracker là một agent Java được thiết kế để theo dõi luồng dữ liệu trong các chương trình Java, giúp hiểu rõ nguồn gốc và ý nghĩa của các đầu ra.
  • Ứng dụng cung cấp một video hướng dẫn và một bản demo trực tiếp để người dùng khám phá các tính năng của nó.
  • Thêm thông tin và truy cập công cụ có thể được tìm thấy trên trang GitHub của nó: https://github.com/coekie/flowtracker.

phản ứng

  • FlowTracker là một agent Java được thiết kế để theo dõi luồng dữ liệu trong các chương trình Java, hỗ trợ trong việc hiểu các đầu ra của chương trình.
  • Người dùng so sánh FlowTracker với các công cụ như jitwatch và theo dõi nhiễm bẩn động, nhấn mạnh tiềm năng của nó trong việc khắc phục sự cố và theo dõi nguồn gốc dữ liệu.
  • Buổi trình diễn giới thiệu khả năng truy vết một phần tử HTML trở lại câu lệnh SQL đã thêm nó vào cơ sở dữ liệu, tạo ra sự phấn khích cho việc tích hợp nó vào các môi trường phát triển khác nhau.

Hiệu suất tốt hơn của mật mã đường cong elliptic “25519”

  • AWS đã cải thiện hiệu suất và độ chính xác của mật mã đường cong elliptic "25519" trong thư viện mã nguồn mở của mình, AWS LibCrypto (AWS-LC), thông qua lý luận tự động và tối ưu hóa cụ thể cho CPU.
  • Những cải tiến này, dựa trên BoringSSL của Google, bao gồm những cải thiện đáng kể về hiệu suất cho các thuật toán x25519 và Ed25519 trên CPU x86_64 và Arm64, với các hoạt động ký Ed25519 tăng 108% và các hoạt động x25519 cải thiện 113%.
  • Những cải tiến đảm bảo thực thi thời gian không đổi để ngăn chặn các cuộc tấn công kênh bên, với tính đúng đắn được xác minh bởi thư viện s2n-bignum và bộ chứng minh định lý HOL Light, làm cho AWS-LC trở thành một lựa chọn mạnh mẽ cho các triển khai mật mã an toàn.

phản ứng

  • Thuật toán mã hóa đường cong elliptic "25519" mới của Amazon cho thấy những cải tiến đáng kể về hiệu suất, đặc biệt là với việc tối ưu hóa AVX512 bởi đội ngũ Firedancer vượt trội hơn so với OpenSSL.
  • Thuật toán x25519 được sử dụng trong các giao thức TLS 1.3 và các sơ đồ lai SSH cho thỏa thuận khóa hậu lượng tử, nhấn mạnh tầm quan trọng của nó trong các giao thức mật mã hiện đại.
  • Codebase của Firedancer, nổi tiếng với việc tối ưu hóa blockchain, được khen ngợi vì hiệu suất và các thực hành lập trình an toàn, góp phần vào việc sử dụng rộng rãi ed25519 thay vì RSA cho các khóa SSH nhờ hiệu suất, bảo mật và khả năng tương thích tốt hơn.

Thư mời Lịch không cần nhấp – Chuỗi lỗ hổng nghiêm trọng không cần nhấp trong macOS

  • Vulnerabilities không cần nhấp chuột trong ứng dụng Lịch của macOS cho phép kẻ tấn công thêm hoặc xóa tệp trong môi trường sandbox của Lịch, có thể dẫn đến việc thực thi mã độc hại và làm tổn hại dữ liệu Ảnh iCloud.
  • Apple đã khắc phục những lỗ hổng này từ tháng 10 năm 2022 đến tháng 9 năm 2023, giải quyết các vấn đề như ghi/xóa tệp tùy ý, thực thi mã từ xa và truy cập dữ liệu ảnh nhạy cảm.
  • Chuỗi khai thác bao gồm nhiều bước để vượt qua bảo mật của macOS, bao gồm né tránh sandbox, vượt qua Gatekeeper và lách bảo vệ TCC, với các bản sửa lỗi được triển khai trong các bản cập nhật macOS khác nhau.

phản ứng

  • Một lỗ hổng nghiêm trọng không cần nhấp chuột trong macOS cho phép kẻ tấn công gửi lời mời lịch độc hại kèm theo tệp đính kèm, có khả năng đánh cắp Ảnh iCloud mà không cần sự tương tác của người dùng.
  • Người dùng đang đặt câu hỏi về tính bảo mật của những lời mời như vậy và đề xuất đưa vào danh sách trắng những người gửi cụ thể như một biện pháp phòng ngừa.
  • Apple đã chậm trễ trong việc trả tiền thưởng cho những lỗ hổng này, gây ra lo ngại về cam kết của họ đối với quyền riêng tư của người dùng và các bản cập nhật kịp thời.

Notepat – Máy tính thẩm mỹ

phản ứng

  • "Notepat" là một dự án nghệ thuật kỹ thuật số của Jeffrey Scudder, có thể truy cập qua trang web aesthetic.computer, với một môi trường máy tính cổ điển và các công cụ độc đáo để tạo ra nghệ thuật kỹ thuật số.
  • Đề án bao gồm các yếu tố tương tác như ứng dụng 'notepat' để sáng tạo âm nhạc, với các lệnh và bố cục bàn phím đặc trưng dựa trên thang âm chromatic.
  • Người dùng có thể khám phá các tính năng khác nhau, bao gồm các trải nghiệm VR như "Freaky Flowers," và dự án này đã thu hút sự quan tâm đáng kể nhờ cách tiếp cận sáng tạo và nghệ thuật đối với các công cụ kỹ thuật số.

Meta đã cung cấp dữ liệu cho AI của mình từ tất cả những gì người lớn đã đăng công khai kể từ năm 2007

  • Meta đã sử dụng các bài đăng và ảnh công khai từ Facebook và Instagram từ năm 2007 để huấn luyện các mô hình AI của mình, trừ khi người dùng đặt bài đăng của họ ở chế độ riêng tư.
  • Người dùng châu Âu có thể từ chối việc sử dụng dữ liệu này do các luật bảo vệ quyền riêng tư địa phương, nhưng người dùng ở các khu vực khác, bao gồm cả Úc, không có tùy chọn này.
  • Meta chưa cung cấp chi tiết rõ ràng về các thông tin cụ thể liên quan đến việc sử dụng và thu thập dữ liệu của mình, gây ra lo ngại về quyền riêng tư cho người dùng.

phản ứng

  • Meta đã sử dụng các bài đăng công khai từ người lớn từ năm 2007 để huấn luyện AI của mình, gây ra cuộc tranh luận về đạo đức và tính hợp pháp của việc sử dụng dữ liệu công khai cho việc huấn luyện AI.
  • Những người phê bình lo ngại về việc tác phẩm của các nhà sáng tạo bị sao chép mà không có sự đồng ý, đặt ra các câu hỏi về việc sử dụng hợp lý và luật bản quyền.
  • Cuộc thảo luận nhấn mạnh sự căng thẳng giữa tiến bộ công nghệ và việc bảo vệ quyền cá nhân.

Trận lở đất ở Greenland gây ra sóng bất thường làm rung chuyển Trái Đất trong chín ngày

  • Vào tháng 8 năm 2023, một trận lở đất ở vịnh hẹp Dickson của Greenland đã gây ra một cơn sóng thần cao 110 mét, tạo ra một con sóng đứng kéo dài trong chín ngày.
  • Ban đầu, các nhà địa chấn học đã xác định sóng này là một "vật thể địa chấn không xác định" (USO) với tần số 11 millihertz, được kích hoạt bởi sự mỏng đi của sông băng do biến đổi khí hậu gây ra.
  • Địa hình và đặc điểm độc đáo của vịnh hẹp đã giữ lại năng lượng của sóng, làm nổi bật tác động đáng kể của biến đổi khí hậu lên các hiện tượng địa chất của Trái Đất.

phản ứng

  • Trận lở đất ở Greenland đã gây ra một cơn sóng thần cao 110 mét, ban đầu được phát hiện khi một cựu nhân viên nhìn thấy trạm nghiên cứu SIRIUS bị bỏ hoang bị cuốn trôi sau khi một tàu du lịch mắc cạn.
  • Trận sóng thần, ban đầu cao 7 mét, đã được phát hiện trong vòng một tuần do sự cố tàu du lịch, mặc dù dữ liệu địa chấn cuối cùng cũng sẽ tiết lộ nó.
  • Thiết bị địa chấn trên toàn thế giới đã ghi nhận sự kiện này, kéo dài chín ngày, nhấn mạnh cách những sự kiện ngẫu nhiên có thể dẫn đến những khám phá quan trọng.

Wallops: Một ứng dụng IRC hiện đại cho hệ điều hành Mac OS cổ điển

  • Wallops, một ứng dụng IRC hiện đại dành cho hệ điều hành Mac cổ điển, đã phát hành phiên bản 2.0, tương thích với System 6 và các phiên bản mới hơn, và bao gồm các cập nhật quan trọng cùng sửa lỗi.
  • Những tính năng chính bao gồm giao diện dạng tab cho nhiều kết nối, kênh và tin nhắn riêng tư, thay đổi kích thước cửa sổ, và sắp xếp danh sách nick được tối ưu hóa cho các kênh lớn.
  • Wallops 2.0 cũng giới thiệu các lệnh mới, các yếu tố giao diện được cải thiện và nâng cao hiệu suất, biến nó thành một công cụ mạnh mẽ cho người dùng IRC trên các hệ thống Mac cổ điển.

phản ứng

  • Wallops là một ứng dụng IRC (Internet Relay Chat) hiện đại được thiết kế cho hệ điều hành Mac OS cổ điển, thu hút sự quan tâm của những người đam mê máy tính cổ.
  • Việc phát hành đã gây ra sự phấn khích do sự hiếm hoi của phần mềm mới cho các hệ thống cũ, với người dùng hồi tưởng về những trải nghiệm của họ với các máy Mac cổ điển.
  • Một số người dùng đã nhận thấy sự cải thiện trong việc giả lập Mac, đề xuất các công cụ như MAME (Multiple Arcade Machine Emulator) cho những ai không có phần cứng cổ điển hoạt động.