跳至主要内容

2024-09-13

OpenAI 新的 o1 連鎖思維模型筆記

  • 「OpenAI 發布了兩個新模型,o1-preview 和 o1-mini,代號為 'strawberry',這些模型通過一種連鎖思維提示模式提供了改進的推理能力。」
  • 「這些模型僅供第 5 級帳戶(API 點數消費達 $1,000 以上)使用,並引入了“推理代幣”,這些代幣會被計費但在 API 回應中不可見,因缺乏透明度而引發了一些不滿。」
  • 新型號可以更好地處理複雜的提示,並增加了輸出標記的允許量,擴展了大型語言模型(LLM)可解決的潛在任務。

評論

  • OpenAI 的新 o1 連鎖思維模型仍然會產生幻覺,例如不存在的函式庫和函數,並且經常提供錯誤的事實。
  • 用戶觀察到,雖然推理能力有所提升,但模型仍無法驗證其輸出內容的真實性,這需要用戶進行二次檢查。
  • 有些使用者將這些模型比作天真但聰明的實習生,認為在適當的指導下它們可以很有用,儘管它們缺乏提出澄清問題或承認不確定性的能力,這影響了它們的可靠性。

“發現研究不當行為的數據偵探被免除誹謗罪”

  • “法院已經清除了Data Colada研究人員在哈佛商學院調查中識別出被操縱數據的誹謗指控。”
  • 儘管哈佛大學確認教授弗朗西斯卡·吉諾存在不當行為,她目前正處於行政休假狀態,並可能失去終身教職,哈佛大學仍將面臨對其處理此案的審判。
  • 法院裁定,有證據支持的結論不構成誹謗,完全清除了 Data Colada 團隊的嫌疑,因為他們採取了謹慎且基於證據的方法。

評論

  • “因指認研究不當行為而被指控誹謗的數據偵探已被清白,案件在進入證據開示階段前即被駁回。”
  • 法院裁定,基於證據的結論關於捏造數據不構成誹謗,支持科學誠信。
  • 被告在 GoFundMe 上籌集了超過 30 萬美元用於法律辯護,強調了在美國誹謗訴訟的高昂費用和情感壓力。

波音工人投票決定罷工

  • 數萬名波音技工在拒絕一份合約提議後,以壓倒性的票數投票支持罷工,並獲得國際機械師與航空工人協會第751區96%的支持。
  • “這場罷工始於波音公司位於華盛頓州的工廠外,可能每週給公司帶來約10億美元的損失,並干擾其從財務和安全挑戰中的復甦。”
  • 儘管提出了四年內加薪25%和提升福利的方案,該協議仍未滿足工會的其他要求;波音公司準備重返談判桌,而拜登政府正在密切關注此情況。

評論

  • 「波音公司的工人已投票決定罷工,其中96%的人拒絕了一項包含顯著加薪的提議。」
  • 機械工會要求更好的薪資、改善工作條件,並要求波音公司「停止違法行為」。
  • 這次罷工突顯了對波音管理層更廣泛的不滿,批評其優先考慮利潤而非工程品質和安全,導致像737 Max墜機這樣的問題。

「FDA 授權首款非處方助聽器軟體」

評論

  • 美國食品藥品監督管理局(FDA)已批准首款非處方助聽器軟體,使 AirPods 可以用作助聽器,這有可能減少污名並提高可及性。
  • 預計此批准將降低成本並鼓勵更多人解決聽力損失問題,儘管對電池壽命和社會觀感的擔憂仍然存在。
  • 用戶反映助聽器和 AirPods 的無障礙功能體驗良好,這標誌著在使助聽器更具經濟性和被接受方面邁出了重要一步。

據報導,遊戲發行商 Annapurna Interactive 的全體員工已經辭職

  • Annapurna Interactive 的全體員工,包括前總裁 Nathan Gary,在未能成功將公司分拆成獨立實體後,已經辭職。
  • Annapurna Interactive 旗下的現有遊戲和項目將繼續由公司管理,最近 Hector Sanchez 被任命為互動和新媒體總裁。
  • Annapurna 計劃將其遊戲業務與電影、電視和劇場部門整合,繼續發行像《Lorelei and the Laser Eyes》和《Open Roads》這樣的遊戲,並推出即將上市的作品如《Blade Runner 2033: Labyrinth》。

評論

  • Annapurna Interactive 的全體員工因與母公司 Annapurna Pictures 在財務整合上的談判失敗而辭職。
  • 「員工和高層管理人員更傾向於分拆,以保持對其創意方向的控制,特別是在《Outer Wilds》和《Stray》等遊戲成功之後。」
  • 這次大規模辭職突顯了遊戲產業內部創意獨立性與財務壓力之間的緊張關係。

您的新創公司需要複雜的雲端基礎設施嗎?

  • 「Pieter Levels 主張使用單一伺服器而非複雜的雲端設置,以專注於產品市場契合度,這在 Lex Friedman Podcast 中有討論。」
  • 兩個案例研究突顯了過於複雜的設置所帶來的陷阱:一個是過多的 Lambda 函數,另一個是不必要的微服務,這兩者都妨礙了功能開發。
  • 現代伺服器和像 Docker Compose 這樣的工具可以提供強大、易管理且經濟實惠的解決方案,使小型團隊能夠專注於打造優秀的產品,而不是管理複雜的基礎設施。

評論

  • 新創公司經常採用像 Kubernetes 這樣複雜的雲端基礎設施來實現可擴展性,但這可能會因為團隊決策不成熟而導致品質不佳和高成本。
  • 一些有經驗的專業人士認為,使用像 Puppet 和 LTS(長期支援)系統這樣的工具來進行更簡單、更可重複的設置,可能會更有效率且更具成本效益。
  • “這場辯論突顯了現代雲原生方法與傳統確定性方法在管理基礎設施上的取捨。”

將 SBCL 移植到 Nintendo Switch

  • Charles Zhang 和 Shinmera 已經花了兩年時間將 Trial 遊戲引擎移植到 Nintendo Switch,專注於適配 Common Lisp 執行環境。
  • 儘管成功在 Switch 上編譯並執行 Lisp 程式碼,但未解決的問題包括垃圾回收和音訊輸出,該專案花費約 17,000 美元。
  • Switch 的 ARM64 Cortex-A57 晶片和 OpenGL 支援使移植成為可能,但仍存在挑戰,例如與 Switch 專有作業系統的介接以及優化 CLOS 編譯。

評論

  • 「SBCL(Steel Bank Common Lisp)正在移植到任天堂 Switch,這對於使用 Common Lisp 進行遊戲開發來說意義重大,因為它具有互動式代碼評估和快速開發週期的特點。」
  • 該專案由 Shinmera 領導,負責處理可移植性和構建架構,強調在專用遊戲硬體上運行 SBCL 的技術挑戰和潛在收益。
  • 在 Switch 上發行遊戲需要使用官方的 Nintendo SDK(軟體開發工具包),因為自製的 SDK 不支援零售主機的發行。

誰擁有 Nebula?

  • “Nebula 是一個專注於教育內容的隨選視訊串流服務,由內容創作者建立,但並非真正由他們擁有。”
  • Standard Broadcast 擁有 Nebula 83.125% 的股份,CuriosityStream 擁有 16.875%,而創作者直接擁有 0%,但他們會獲得銷售利潤和收益的 50%。
  • 創作者擁有「影子股權」,這意味著他們的報酬方式類似於擁有者,但並不持有實際的股票,這引發了關於平台是否與創作者價值觀一致的疑問。

評論

  • 星雲由標準廣播有限責任公司(Standard Broadcast LLC)擁有,44位創作者擁有影子股權而非直接所有權,以避免後勤和稅務問題。
  • 如果 Nebula 被出售,創作者將獲得收益的 50%,但有些人認為這種結構缺乏透明度和真正的合作所有權。
  • 批評者聲稱,這種行銷具有誤導性,因為創作者並不直接擁有 Nebula 的股權或控制權。

FlowTracker – 追蹤 Java 程式中的資料流動

  • FlowTracker 是一個 Java 代理程式,旨在追蹤 Java 程式中的資料流動,幫助理解輸出的來源和意義。
  • 它提供了影片教學和現場示範,讓使用者可以探索其功能。
  • 更多資訊及工具的使用方式可以在其 GitHub 頁面找到:https://github.com/coekie/flowtracker。

評論

  • “FlowTracker 是一個 Java 代理程式,旨在追蹤 Java 程式中的資料流,協助理解程式輸出。”
  • 用戶將 FlowTracker 與 jitwatch 和動態汙點追蹤等工具進行比較,強調其在故障排除和數據來源追蹤方面的潛力。
  • 該示範展示了其追溯 HTML 元素至將其新增到資料庫的 SQL 語句的能力,這為其整合到各種開發環境中帶來了興奮。

性能更佳的「25519」橢圓曲線密碼學

  • AWS 已經透過自動化推理和針對 CPU 的優化,提升了其開源庫 AWS LibCrypto(AWS-LC)中「25519」橢圓曲線密碼學的性能和正確性。
  • 這些基於 Google 的 BoringSSL 的改進,包括在 x86_64 和 Arm64 CPU 上對 x25519 和 Ed25519 演算法的顯著性能提升,其中 Ed25519 簽名操作提升了 108%,而 x25519 操作提升了 113%。
  • 這些增強功能確保了恆定時間執行,以防止側信道攻擊,並由 s2n-bignum 函式庫和 HOL Light 定理證明器驗證其正確性,使 AWS-LC 成為安全加密實作的可靠選擇。

評論

  • Amazon 的新型「25519」橢圓曲線密碼學展示了顯著的性能提升,特別是由 Firedancer 團隊優化的 AVX512 實現超越了 OpenSSL。
  • 在 TLS 1.3 和 SSH 混合方案中使用的 x25519 演算法,用於後量子密鑰協議,突顯了其在現代加密協議中的重要性。
  • “Firedancer 的代碼庫以區塊鏈優化聞名,其性能和安全編程實踐備受讚譽,這也促進了 ed25519 相較於 RSA 作為 SSH 金鑰的更廣泛採用,因為它在性能、安全性和相容性方面表現更佳。”

零點擊日曆邀請——macOS 中的關鍵零點擊漏洞鏈

  • macOS Calendar 中的一個零點擊漏洞允許攻擊者在 Calendar 沙盒內添加或刪除檔案,可能導致惡意程式碼執行並危及 iCloud Photos 資料。
  • 蘋果在 2022 年 10 月至 2023 年 9 月期間修復了這些漏洞,解決了任意文件寫入/刪除、遠端代碼執行以及存取敏感照片數據等問題。
  • 該漏洞鏈涉及多個步驟來繞過 macOS 的安全性,包括沙盒逃逸、Gatekeeper 繞過和 TCC 保護規避,並在各個 macOS 更新中實施了修復。

評論

  • macOS 中的一個嚴重零點擊漏洞允許攻擊者發送帶有附件的惡意日曆邀請,可能在無需用戶互動的情況下竊取 iCloud 照片。
  • 用戶正在質疑此類邀請的安全性,並建議將特定發件人列入白名單作為預防措施。
  • 蘋果在支付這些漏洞的獎金方面進展緩慢,這引發了對其對用戶隱私和及時更新的承諾的擔憂。

Notepat – 美學電腦

評論

  • "Notepat" 是由 Jeffrey Scudder 創作的數位藝術專案,可透過網站 aesthetic.computer 存取,該專案展示了一個復古的計算環境和獨特的數位藝術創作工具。
  • 該專案包含互動元素,例如一個用於音樂創作的『notepat』應用程式,具有命令和基於半音階的獨特鍵盤佈局。
  • 使用者可以探索各種功能,包括像「怪異花卉」這樣的 VR 體驗,該專案因其創新且藝術性的數位工具應用而引起了極大的興趣。

Meta 自 2007 年以來,將所有成年人公開發佈的內容餵給其 AI

  • 自2007年以來,Meta 一直使用來自 Facebook 和 Instagram 的公開貼文和照片來訓練其 AI 模型,除非用戶將其貼文設為私人。
  • 「歐洲用戶可以根據當地的隱私法選擇不使用這些數據,但其他地區的用戶,包括澳洲,則沒有這個選項。」
  • Meta 尚未提供有關其數據使用和收集時間表的具體細節,這引起了用戶對隱私的擔憂。

評論

  • 自2007年以來,Meta 一直使用成人的公開貼文來訓練其 AI,這引發了關於使用公開數據進行 AI 訓練的倫理和合法性辯論。
  • 批評者擔心創作者的作品在未經同意的情況下被複製,這引發了對合理使用和版權法的質疑。
  • 這場討論強調了科技進步與個人權利保護之間的緊張關係。

「格陵蘭島山崩引發異常海浪,震動地球長達九天」

  • 2023年8月,格陵蘭的迪克森峽灣發生了一場山崩,造成了一個110公尺高的海嘯,並形成了一個持續九天的駐波。
  • 「地震學家最初將該波形識別為一個頻率為11毫赫茲的『不明地震物體』(USO),其由氣候變遷引起的冰川變薄所觸發。」
  • 峽灣獨特的形狀和特徵困住了波浪的能量,突顯了氣候變遷對地球地質現象的重大影響。

評論

  • “格陵蘭的一場山崩引發了一場110公尺高的海嘯,最初是由一位前員工注意到的,當時他看到一艘郵輪擱淺後,一個被遺棄的SIRIUS研究站被沖走。”
  • 由於郵輪事件,最初高達 7 公尺的海嘯在一週內被偵測到,儘管地震數據最終也會揭示它。
  • “全球的地震儀器記錄了這次事件,該事件持續了九天,突顯了隨機事件如何能夠導致重大的發現。”

「Wallops:一款適用於經典 Mac OS 的現代 IRC 客戶端」

  • 「Wallops,一款適用於經典 Mac OS 的現代 IRC 客戶端,已經發布了 2.0 版本,兼容 System 6 及更新版本,並包含了重大更新和錯誤修正。」
  • 主要功能包括多重連線、頻道和私人訊息的分頁介面、視窗調整大小,以及針對大型頻道優化的暱稱列表排序。
  • Wallops 2.0 也引入了新的指令、改進的介面元素和性能增強,使其成為經典 Mac 系統上 IRC 使用者的強大工具。

評論

  • 「Wallops 是一款為經典 Mac OS 設計的現代 IRC(網際網路中繼聊天)客戶端,吸引了復古電腦愛好者的興趣。」
  • “由於為舊系統推出新軟體的稀有性,這次發佈引發了興奮,使用者們紛紛回憶起他們使用經典 Mac 的經歷。”
  • 有些使用者注意到 Mac 模擬的改進,建議那些沒有運作中的復古硬體的人使用像 MAME(多重街機模擬器)這樣的工具。