2023 年 5 月 26 日
- 你一直想知道的关于数学的一切》是一本数学教科书,用于卡内基梅隆大学 CS 和数学本科生的第一学期课程。
- 该书包括对每一章的介绍,使其在语气上更具对话性。
- 评论者推荐了学习数学的各种资源,包括书籍、网站和在线课程,同时也提供了接近该学科的技巧。
- 一名举报人向一家德国新闻媒体泄露了特斯拉的 23000 多份内部文件,揭示了据称被公司忽视的危险自动驾驶故障模式。
- 这些文件包含 2400 多份自我加速投诉和 1500 多份制动功能问题,包括幻象制动或意外加速,以及 1000 多份事故报告--主要是在美国和德国。
- Handelsblatt 与弗劳恩霍夫安全信息技术研究所确认了数据的真实性,该研究所没有发现任何篡改或捏造的证据。特斯拉试图阻止这篇报道,但 Handelsblatt 以欧盟法律规定的公共利益的紧急事项为由将其发表。
- 一名举报人泄露了 100GB 的特斯拉机密文件,揭示了该公司自动驾驶软件的潜在系统性故障。
- 特斯拉首席执行官埃隆-马斯克(Elon Musk)声称自动驾驶汽车的价值将翻五倍,这一点受到了投资者的质疑,但也有人称赞他过度炒作、延迟和最终成就的成功公式。
- 特斯拉在整个汽车市场的份额正在增长,但他们在电动汽车市场的份额正在萎缩,这可能是一个不好的迹象。此外,特斯拉汽车的更换部件价格昂贵,导致保险费用上升,批评者认为特斯拉的行为对客户不友好,剥夺了客户的信息。
- AI Canon 是一个资源集合,涵盖了现代 AI 最重要的部分。
- 它包括基础性的学习材料、实用指南、市场分析和标志性的研究结果。
- 主要论文涵盖了变压器模型、生成性人工智能和现代 LLMs,包括 GPT-3。
- 具有里程碑意义的研究成果包括谷歌的 LaMDA 和 OpenAI 的 GPT-4,等等。
- 各种模型,包括斯坦福大学和 Facebook 的模型,旨在通过信息检索提高 LLM 的准确性。
- 宪法人工智能提出了自主和无害的人工智能助手的想法,各种平台增强了 LLM 的预测能力。
- 来自谷歌、东北大学和 Meta 的生成代理寻求提高 LLMs 的技能。
- 研究旨在开发生成代码、视频、图像和音频的技术。
- DeepMind 和 Med-PaLM 的工作旨在通过蛋白质结构预测和能够回答 USMLE 风格问题的语言模型来提高医学领域。
- 风险投资公司 a16z 发布了一份 "AI Canon",这是一份了解 AI 的 50 个最佳资源清单,涵盖了 AI 的不同领域以及依靠 AI 运作的软件和平台。
- Hacker News 的读者批评了 a16z 的投资行为和过去的表现,一些人对其参与加密货币、NFTs 和 Web3 表示不赞成。
- 一些读者提供了关于生成性人工智能的额外资源,包括教科书,而另一些人则讨论了对加密货币的怀疑态度,并赞扬了 AI Canon 是一个有用的链接列表。
- 了解如何使用 Lit-Parrot 在自定义数据集上微调大型语言模型(LLM),Lit-Parrot 是 GPT-NeoX 模型的一个基于 nanoGPT 的实现,支持 StableLM、Pythia 和 RedPajama-INCITE 模型权重。
- 借助 Lit-Parrot,你可以在特定的指令数据集上对现有的高质量开源 LLM 进行微调,如 Open LLaMA、StableLM 和 Pythia,例如训练一个聊天机器人来回答金融问题。
- Lightning AI 发布了 Lit-Parrot,为 AI/ML 社区提供了一个干净、扎实、优化的大型语言模型实现,并使用 LoRA 和 Adapter 支持预训练和微调,本文指导读者完成安装、下载模型权重、处理数据集,以及使用 finetune_adapter.py 和 generate_adapter.py 脚本微调模型的过程。
- 微调是提高 LLM 在狭义使用情况下性能的一种经济有效的方法。
- 使用矢量数据库和嵌入可以提供背景,但微调可以增强 LLM 提供准确和相关信息的能力。
- 然而,微调模型也有污染和过度拟合的风险。