跳到主要内容

26

2023 年 5 月 26 日

你一直想知道的数学知识(2013)[pdf]

行业反应

  • 你一直想知道的关于数学的一切》是一本数学教科书,用于卡内基梅隆大学 CS 和数学本科生的第一学期课程。
  • 该书包括对每一章的介绍,使其在语气上更具对话性。
  • 评论者推荐了学习数学的各种资源,包括书籍、网站和在线课程,同时也提供了接近该学科的技巧。

举报人向德国新闻网站投放 100GB 的特斯拉机密

  • 一名举报人向一家德国新闻媒体泄露了特斯拉的 23000 多份内部文件,揭示了据称被公司忽视的危险自动驾驶故障模式。
  • 这些文件包含 2400 多份自我加速投诉和 1500 多份制动功能问题,包括幻象制动或意外加速,以及 1000 多份事故报告--主要是在美国和德国。
  • Handelsblatt 与弗劳恩霍夫安全信息技术研究所确认了数据的真实性,该研究所没有发现任何篡改或捏造的证据。特斯拉试图阻止这篇报道,但 Handelsblatt 以欧盟法律规定的公共利益的紧急事项为由将其发表。

行业反应

  • 一名举报人泄露了 100GB 的特斯拉机密文件,揭示了该公司自动驾驶软件的潜在系统性故障。
  • 特斯拉首席执行官埃隆-马斯克(Elon Musk)声称自动驾驶汽车的价值将翻五倍,这一点受到了投资者的质疑,但也有人称赞他过度炒作、延迟和最终成就的成功公式。
  • 特斯拉在整个汽车市场的份额正在增长,但他们在电动汽车市场的份额正在萎缩,这可能是一个不好的迹象。此外,特斯拉汽车的更换部件价格昂贵,导致保险费用上升,批评者认为特斯拉的行为对客户不友好,剥夺了客户的信息。

AI Canon

  • AI Canon 是一个资源集合,涵盖了现代 AI 最重要的部分。
  • 它包括基础性的学习材料、实用指南、市场分析和标志性的研究结果。
  • 主要论文涵盖了变压器模型、生成性人工智能和现代 LLMs,包括 GPT-3。
  • 具有里程碑意义的研究成果包括谷歌的 LaMDA 和 OpenAI 的 GPT-4,等等。
  • 各种模型,包括斯坦福大学和 Facebook 的模型,旨在通过信息检索提高 LLM 的准确性。
  • 宪法人工智能提出了自主和无害的人工智能助手的想法,各种平台增强了 LLM 的预测能力。
  • 来自谷歌、东北大学和 Meta 的生成代理寻求提高 LLMs 的技能。
  • 研究旨在开发生成代码、视频、图像和音频的技术。
  • DeepMind 和 Med-PaLM 的工作旨在通过蛋白质结构预测和能够回答 USMLE 风格问题的语言模型来提高医学领域。

行业反应

  • 风险投资公司 a16z 发布了一份 "AI Canon",这是一份了解 AI 的 50 个最佳资源清单,涵盖了 AI 的不同领域以及依靠 AI 运作的软件和平台。
  • Hacker News 的读者批评了 a16z 的投资行为和过去的表现,一些人对其参与加密货币、NFTs 和 Web3 表示不赞成。
  • 一些读者提供了关于生成性人工智能的额外资源,包括教科书,而另一些人则讨论了对加密货币的怀疑态度,并赞扬了 AI Canon 是一个有用的链接列表。

如何在自定义数据集上微调类似 GPT 的大型语言模型

  • 了解如何使用 Lit-Parrot 在自定义数据集上微调大型语言模型(LLM),Lit-Parrot 是 GPT-NeoX 模型的一个基于 nanoGPT 的实现,支持 StableLM、Pythia 和 RedPajama-INCITE 模型权重。
  • 借助 Lit-Parrot,你可以在特定的指令数据集上对现有的高质量开源 LLM 进行微调,如 Open LLaMA、StableLM 和 Pythia,例如训练一个聊天机器人来回答金融问题。
  • Lightning AI 发布了 Lit-Parrot,为 AI/ML 社区提供了一个干净、扎实、优化的大型语言模型实现,并使用 LoRA 和 Adapter 支持预训练和微调,本文指导读者完成安装、下载模型权重、处理数据集,以及使用 finetune_adapter.py 和 generate_adapter.py 脚本微调模型的过程。

Industry Reactions

  • 微调是提高 LLM 在狭义使用情况下性能的一种经济有效的方法。
  • 使用矢量数据库和嵌入可以提供背景,但微调可以增强 LLM 提供准确和相关信息的能力。
  • 然而,微调模型也有污染和过度拟合的风险。

Firefox 在一个不相关的页面上显示了 Mozilla VPN 的弹出式广告

  • 火狐浏览器在一个不相关的页面上显示 Mozilla VPN 的弹出式广告,使火狐浏览器的其他界面失效,直到关闭。
  • 多个用户报告了类似事件,可能与 1834728 号漏洞有关。
  • Mozilla 已经承认了这个问题,并在其支持页面上提供了一个解决方法。

行业反应

  • Mozilla 因在浏览时显示其 VPN 的弹出式广告而面临反击,这违反了用户的同意权
  • 用户对 Mozilla 的发展方向表示不满,包括其将重点放在广告和其他不相关的产品上,而不是改善 Firefox 的核心浏览器体验
  • 一些用户建议使用 LibreWolf 这样的替代品,而另一些用户则呼吁 Mozilla 更加透明和尊重用户的隐私。

战争是个骗局(1935)

  • 战争是个骗局》是前高级海军陆战队员斯梅德利-巴特勒少将的一本著名小册子。
  • 巴特勒用简单的语言讲述了战争的性质和原因。
  • 这本小册子虽然写于 1935 年,但现在仍有意义。

行业反应

  • 评论中讨论了美国军事主导地位的好处和坏处以及军工联合体的作用,对效率和更好地分配资源提出了各种观点。
  • 对话还涉及到阿富汗、伊拉克和乌克兰等具体冲突,对干预的有效性和道德性的意见差别很大。
  • 评论区反映了对政治和社会问题的各种意见,并作为一个例子,说明讨论如何能够螺旋式地进入切题。

科罗拉多州废除了限制市政互联网的法律

  • 科罗拉多州废除了一项限制市政互联网的法律,要求选民允许在其社区建设先进的宽带互联网服务,使地方政府更容易探索宽带选项。
  • 该法律曾被有线电视行业宣传为防止在市政互联网等基础设施项目上浪费纳税人的钱,但它已成为科罗拉多州许多城镇和县城的障碍。
  • 废除该法后,科罗拉多州不再需要公民投票,并使科罗拉多州有资格获得联邦宽带资金,而科罗拉多州的一些城市,如普埃布洛,正在努力为其居民提供更好的宽带选择。

行业反应

  • 科罗拉多州废除了一项限制市政互联网的法律,理由是有线电视行业为了防止纳税人的钱被浪费在基础设施项目上而产生的利益,是该法律背后的动机。
  • 市政互联网在朗蒙特和查塔努加等城市取得了成功,为居民提供了可靠的、可负担的、不受限制的互联网接入。
  • 对称的光纤互联网,特别是在在家工作已成为常态的地区,正变得越来越重要。

法律硕士概念的视觉直观解释(法律硕士大学)

  • 法学硕士大学对法学硕士的概念进行了形象直观的解释。
  • 该平台允许用户从一个仪表板上访问不同的模块。
  • 这些解释旨在简化复杂的法律概念,使其更容易理解。

行业反应

  • LLM 大学发布了一个关于大型语言模型的免费课程,其中有视觉和直观的解释、代码示例和视频内容。
  • 该课程强调了 LLM 的应用,而不是其理论或培训,并欢迎对未来内容提出建议。
  • 一些用户对材料的可及性表示关注,并有关于 LLM 可解释性的论文。Jay Alammar 的相关技术内容已经收到了积极的反馈。

Deno 1.34: Deno 编译支持 NPM 包

  • Deno 1.34 版本的重点是改善与 npm 和 Node.js 的兼容性,提高整体生活质量和开发者体验,并为未来的性能改进奠定基础。
  • 主要功能包括支持 Deno 与 npm 包的编译,Deno 任务和 CLI 标志中的 glob 支持,以及带有 IP 地址的 TLS 证书。
  • 其他改进包括配置文件的改进,语言服务器的改进,Deno API 的变化,npm 和 Node.js 兼容性的改进,以及 V8 和 TypeScript 的更新。

行业反应

  • Deno 1.34 现在支持 NPM 包,导致了关于项目方向和重点的讨论。
  • 有人担心 NPM 的兼容性会减损 Deno 的最初愿景,而其他人则认为这对更广泛的采用是必不可少的,而不一定会损害纯 Deno 项目。
  • 利益相关者强调软件开发中实用性和实用主义的重要性,这可能涉及到权衡和妥协。

在 Go 中实现 Raft 的基础上实现分布式键值存储

  • 这是一篇解释如何在 Go 中实现 Raft 的基础上实现分布式键值存储的文章。
  • 该帖涵盖了 Raft 的两个关键组件:领导者选举和日志复制,还介绍了重构和快照。
  • 该帖子包括用状态机建模和 HTTP 端点的构建,仅为教育目的而创建。

行业反应

  • 该文章因其对高级概念的覆盖和长期项目的投入而受到赞扬
  • 技术面试被批评为过于简单或与寻找优质工程师无关
  • 开发人员讨论了分布式数据库和构建 Raft 实现的经验,提出了其他可扩展性方法和学习资源。