20
2023 年 4 月 20 日
StableLM: 一个新的开源语言模型
新闻
- StableLM 是一个为自然语言处理任务设计的新的开源语言模型。
- 该模型的独特之处在于,它允许用户在自己的特定数据集上进行训练和微调,从而提高特定任务的语言学习性能。
- 它的结构是基于 BERT 的,它的设计是为了尽量减少灾难性遗忘。
- 该模型在一个大型文本语料库上进行了预训练,包括维基百科和 Common Crawl。
- 该软件很容易使用,可以在 GitHub 上访问,并有文档帮助用户开始使用。
- StableLM 已经被用于各种应用,包括文本分类和情感分析。
行业反应
- Stability.AI 发布了一个新的开源语言模型,名为 StableLM,模型的参数范围从 3B 到 65B,上下文宽度为 4096。
- 模型评估受到了批评,但对于想要改进模型的开发者来说,这是一个很好的选择,因为它是开放源代码。
- StableLM alpha 模型正在测试中,预计将超过 Pythia 6.9B 的性能,并将在高达 1.5 万亿的标记上进行训练。
- 较大的模型学习速度更快,但容易过度拟合,企业让消费者为计算能力预先付费。
- 优化的 ML 框架在消费者硬件上越来越容易获得,但好的语言模型目前需要昂贵的 GPU,这使得云 API 成为唯一的选择。
- 通过 API 提供语言模型可以实现高度优化的推理,但本地计算可以在人工智能应用中实现更多隐私。
- 斯坦福大学的研究人员以开源许可的方式发布了 StableLM,这得到了不同的意见。
- 人工智能的发展和使用是热门话题,对超级智能人工智能接管世界的看法不一。
让 Linux 家庭服务器在空闲时睡觉,在需要时醒来--简单的方法
新闻
- 文章详细介绍了如何配置运行 Ubuntu Linux 的家庭服务器,使其在空闲时睡觉并按需唤醒,以托管 Time Machine 备份。
- 启用网络唤醒功能,通过单播数据包唤醒服务器。
- 网络服务,包括 ARP Stand-in 和 Avahi,被配置为在服务器睡眠时保持网络连接。
- 共享代码以确定空闲/繁忙状态,并通过一个 cron job 自动暂停到 RAM。
- 需要一个单独的永远在线的 Linux 设备和支持单播包的 Wake-on-LAN 的网络接口设备。
- ARP Stand-in 允许网络设备代表沉睡的服务器响应 ARP 请求,触发其唤醒。
- 作者使用 Ruby 和 libpcap 以及针对沉睡服务器 IP 地址的 ARP 请求包的过滤器来实现 ARP Stand-in。
- 解决了由 AFP 数据包和 NetBIOS 查询引起的不必要的唤醒问题。
- 文章解释了如何禁用 IPv6 并使用端口镜像来捕获来自服务器和网络其他部分之间的中间设备的数据包。
- Avahi 被作者用作 ARP 的替身服务。
- 作者使用 avahi-publish 来配置 Raspberry Pi。
- 作者创建了一个 systemd 服务定义,在启动时自动运行 avahi-publish。
- 一个多月来,设置一直很成功。
行业反应
- Raspberry Pi 是低功耗服务器的一个流行选择,但一些用户建议用它来同步文件到一个 "真正的 "备份服务器,而不是按需设置。
- 关于低功耗服务器操作的建议包括使用 wifi 和配置以太网以实现低功耗操作。
- 建议使用其他迷你电脑,如 Beelink 和 Topton NAS 板。
- 建议使用 ChatGPT,以便更快地排除故障。
- 讨论了省电功能和围绕 "闲置 "定义的困难。
- 对局域网设置的唤醒和自我托管的备份与云服务的对比进行了辩论,以及对隐私和监控的关注。
- 读者分享了如何优化电力使用的技巧,如降低硬盘转速和使用高能效的电源。
- 讨论了 IPv6 技术及其好处。
- 讨论了尽量减少家庭服务器的电力使用的策略。
- ARP 欺骗可以用来唤醒沉睡的服务器。
用户: Junnn11
新闻
- 该帖子提供了各种古代节肢动物的重建和图解,包括 Euarthropods, Dinocaridids, lobopodians 等。
- 用户 Junnn11 是一位节肢动物爱好者,主要研究泛节肢动物的头部问题、跨节肢动物亚型和干系的系统发育、基底螯足动物、恐龙类和叶节动物。
- 帖子中列出了各种类型的福寿螺类、巨齿鲨类、吡咯咯类、突触类、恰斯马特类、有尾蛇类、蛛形纲等。
- 还有各种古代节肢动物的解释图。
- 该帖子提供了该用户的日本维基百科页面和 Twitter 账户的链接。
- 帖子中没有提到新的或最近的版本。
行业反应
- Discussion Service 上的帖子展示了个人对利基学科的深入投入,包括技术、生物学和建模。
- 用户讨论了投资此类主题的好处和 坏处,包括对动机的影响和博士对自己兴趣的合法化。
- 用户 Junnn11 在维基百科页面上描绘节肢动物的生物力学和运动的插图,引发了关于生物学、遗传学和视觉概念的讨论。
- 用户还讨论了 "节肢动物的头部问题 "和用户设计偏好,如懒惰加载的图片。
- 在网页上默认加载标签是一个隐私问题,目前在 Safari 或 Firefox 中没有实现,而且可能会破坏一些网站。
- MediaWiki 应用程序是一个创建用户生成内容的 PHP 平台,Junnn11 在一个用户页面上的昆虫插图获得了关注。
- Y Combinator 正在接受 2023 年夏季的申请。
离线就是在线,有极强的延迟性
新闻
- 彼得-范-哈登伯格提倡本地优先的软件,程序在设备上运行,并利用云的 "耐久性或可及性",而不依赖它。
- 传统的企业级软件和云服务就像建造昂贵的航空母舰,而此时需要的是简单的、个人的、易于维护的工具。
- 在线和离线应该被认为是一个具有不同程度延迟的连续体。
- 离线只是延迟的最极端形式,它有自己的梯度,包括秒、分钟、小时、天,以及更多。
- 将在线/离线二元的想法转变为延迟的频谱,为构建不同的东西打开了新的大门。
行业反应
- 这篇文章讨论了离线与在线应用的概念,以及围绕它们是否应该被视为相同或不同的类别并有各自的要求的辩论。
- 对话深入探讨了悲观与乐观的用户界面以及数据定位与数据所有权。
- 在处理离线应用程序时,冲突解决是一个复杂的问题,解决方案应该被设计为同时处理在线和离线环境。
- 提出了向基于数据同步的产品方法的转变。
- 线下优先的体验必须被精心设计,将所有的东西都作为真理的来源,并处理模式和业务逻辑的迁移。
- 由于隐私和控制方面的考虑,一些用户喜欢点对点的应用,而不是基于互联网的服务。
- 方法的选择(本地 vs.基于云)取决于用户的需求和偏好。
- 讨论涉及到技术挑战,如 NAT 和发现系统,并讨论了潜在的解决方案,包括联合标准和网状网络。
- 提到了谷歌地图、iMessage 和天气应用等应用中离线容忍的重要性。
- 讨论集中在离线优先是否是协作工具的可行解决方案。
- 不同的评论者讨论了离线与在线通信的利弊以及弹性设计的重要性。
我的大部分技能现在一文不值,但有 10%的技能却价值 1000 倍
新闻
- 像 ChatGPT 这样的 AI 技术可以改变软件开发技能的价值
- 虽然有些技能可能会变得不那么有价值,但人工智能可以为利用剩余技能提供新的机会
- ChatGPT 可以使任务自动化,开发复杂问题的解决方案,并帮助开发人员进行合作
- 保持人类开发者的专业知识是不可或缺的,而验证人工智能的输出是至关重要的。
- 整合人工智能工具可以在不牺牲质量的情况下提高效率
- 人类的创造力、专业知识和批判性思维不能被人工智能所取代
- 软件开发者应该拥抱人工智能,同时认识到其独特的价值。
行业反应
- ChatGPT 可以为简单的技术任务提供准确的答案,但在更复杂的任务上可能会自信地出错。
- ChatGPT 的答案质量可以通过在更高质量的语料库中训练来提高,而其他人则警告说不要过于依赖人工智能进行学习。
- 大型语言模型在某些方面可能缺乏原始材料,但与 ChatGPT 互动的能力和纠正措施可能会有帮助。
- ChatGPT 可以为非专业人士提供基本信息,但可能需要验证和核实。
- 生成模型可以使写作民主化,并帮助产生更多的文本,但怀疑论者认为它可能导致文盲和消除 一些写作工作。
- 人工智能生成的文本可能会导致淘汰低薪的写作工作,但可能不会影响高薪和高质量的写作。
- 人工智能聊天机器人可以产生糟糕的代码,立法者和法官采用生成的文本是一个问题。
- 人工智能驱动的语言模型提高了作家的生产力,但不能完全取代优秀的作家。
- 写作可能很快成为每个人工作的重要部分,但许多作家和编辑可能需要改变职业。
- 技术和人工智能一再使旧的做事方式被淘汰,包括银行和电子表格中的人类计算机,但它不能取代平面设计师的核心能力。
为什么一些研究人员认为我对社交媒体和精神疾病的看法是错误的
新闻
- 社会科学家们正在就社交媒体是否是青少年精神疾病流行的主要原因进行辩论。
- 批评者认为,证据不足以支持伤害的说法。
- 支持者认为,从 2012 年左右开始,青少年的心理健康正在发生一些重大变化,没有其他解释。
- 精神疾病的发病率和社交媒体的使用并没有明确的因果关系,但怀疑论者无法像 SSM 理论那样整齐地 解释这一流行病。
- 怀疑论者要求以 "排除合理怀疑 "为基础的高度怀疑论,这对民事案件来说是不合适的。
- 对于使用社交媒体和心理健康问题之间的相关性大小,科学家们存在分歧。
- 社交媒体可能对女孩特别有害。
- 研究人员在将一个问题转化为他们可以测量的变量时,往往专注于一个因果模型,这可能会掩盖其他潜在的因果途径。
- 可以解释青少年心理疾病上升的两个因果模型是敏感期模型和 IRL 损失模型。
- 作者建议采取一些措施,如将智能手机推迟到高中,建立无手机学校,并将 "网络成人 "的年龄提高到 16 岁。
- 联邦政府在减少未成年人使用智能手机方面无所作为,有必要在全国和全球范围内讨论智能手机和社交媒体是否会干扰青少年的健康成长。
- 需要怀疑论者对敲响警钟者提出反驳,并指出证据中的弱点。
- 智能手机的年龄验证可以通过 Clear 等公司已经提供的创新方法完成。
行业反应
- 社交媒体的持续的同伴监视和成瘾性正在导致心理健康问题,缺乏睡眠,以及个人成长。
- 讨论强调,需要对社交媒体对心理健康的影响有一个细致的了解,包括抑郁症、欺凌和自杀。
- 向鼓励成瘾行为的始终在线的视频游戏的转变令人担忧,一些人认为应采取措施保护 18 岁以下的人。
- 社交媒体限制了儿童的独立发展,从而影响了他们的生活,缺乏户外活动是一个需要解决的问题。
- 在了解抑郁症的 原因方面,讨论了自我报告和人口水平数据的可靠性。
- 现有证据支持社交媒体导致心理健康问题的说法,而因果关系的方向很难确定。
- 讨论了气候变化对年轻人心理健康的影响,围绕它的行动主义的缺乏,以及公司、政府和个人的作用。
- 还提到了能源消耗和缺乏理想的化石燃料替代品,以及不良的养育方式。
ChatPDF - 与任何 PDF 聊天
新闻
- ChatPDF 为学生提供了一个增强学习经验的工具,有助于理解教科书和研究论文。
- 该平台可以有效地分析一系列文件,包括财务和销售报告、项目建议书、培训手册和法律合同。
- ChatPDF 为机密数据提供安全的云存储,并能随时删除。
- 对于好奇心强的人来说,ChatPDF 可以从历史文件、文献和其他来源中发掘出大量的知识。
- 该工具可以理解任何语言,并可以用用户喜欢的语言进行回复。
- ChatPDF 提供 API、定价选项、常见问题、联盟计划,并通过 Twitter 和电子邮件提供支持。
行业反应
- ChatPDF 是一项 新的服务,允许用户使用 OpenAI 的 GPT API 生成关于 PDF 文件的问题。
- 对改进该服务提出的建议包括调整块的大小,优化语义搜索或递归以适应更复杂的 PDF,以及对 PDF 文本进行分块。
- 一些用户表示怀疑,而其他用户则指出了改进搜索结果和语义索引等好处。
- 对于使用敏感文件,建议使用 ChatGPT 的其他自我托管解决方案
- ChatPDF 与其他语义索引服务类似,并提出了可能的改进建议,如试用版
- 一些评论者对围绕 GPT 的炒作开玩笑,AI 模型建议使用其他文件类型进行分析
GIMP 的 GTK+3 移植正式完成
News
- 在提供的文本中没有发现有意义的内容。
业界反应
- GIMP 的 GTK+3 移植现在已经完成。
- 向后兼容对于用户空间来说是至关重要的,而 Windows 的兼容性水平对于个别应用程序来说是值得称赞的。
- 很少有解决方法可以用相关的库来运行旧的 Linux 东西。
- 蝶变 12 将继续包括 GTK2,尽管有些发行版正试图删除它。
- 建立一个高质 量的 GUI 工具包需要成熟、完整和努力。
- 一些 UI 工具包缺乏通用的部件,迫使开发者使用第三方的部件。
- 一位开发者提议使用抽象语法树来实现 API 和界面的无缝二进制兼容。
- GIMP 希望转移到 GTK4,以获得更好的 Wayland 兼容性、对 HiDPI 的支持和更简洁的外观。
- 非破坏性编辑计划在 GIMP 3.2 中引入。
- 我们鼓励用户切换到 GTK3 或 GTK4,但意见不一。
- KDE 和它的应用程序是 GTK 的潜在替代品。
卫星拍摄另一颗卫星的图像
News
- 没有有意义的内容存在,不能提供摘要。
行业反应
- NASA 的 Landsat 卫星拍摄了另一颗卫星的图像,引发了围绕卫星技术和工程的讨论。
- 用户分享了关于各种卫星的有趣事实,包括激光测距和情报卫星。
- 各公司正在研究通过将卫星送到离地球更近的地方进行更好的成像的项目。
- Maxar 技术公司发布了一段视频,显示他们的 WorldView-4 卫星在轨道上拍摄另一颗卫星的图像,并增加了定位的矢量。
- 一些评论家注意到由反射式航天器绝缘层引起的 "闪光 "反射。
- 尽管社交媒体上有负面评论,但这段视频被认为是太空成像的商业可行性不断提高的证据。
如何制作好的小游戏
新闻
- 用更简单的工具制作小游戏可以增加新开发者的成功机会。
- 在复杂的引擎中挣扎会使人们对制作游戏望而却步。
- 一个游戏的情感范围并不能决定其质量。
- 小游戏可以有不同的成功定义,重要的是要适应这些微妙的情感,以获得全面的体验。
- 从各种渠道汲取灵感,创造独特的游戏。
- 选择外形因素会影响玩家的期望,所以在选择引擎和准备发布时要考虑这一点。
- 在发布游戏之前完成你的游戏,避免发布 "待续 "游戏。
- 从支持的社区获得反馈是很重要的。
- 专注于制作你喜欢和满意的游戏,而不是试图制作一个杰作或 "伟大 "的东西。
- 作者鼓励读者专注于建立积极和支持性的社区,在工作中找到创造性的成就感,而不是变得痛苦或幻灭。
行业反应
- 文章讨论了制作好的小游戏和避免完美主义的方法,如确定想法的优先次序和孵化多个游戏想法。
- 文章强调了游戏测试和设计小型、迭代版本游戏的重要性,以及平衡游戏的公平性和限制项目范围。
- 一些评论者指出,某些游戏类型可能很难在不从根本上改变它们的情况下提炼成小游戏。
- 该帖子强调了制作小型游戏的好处,包括有机会探索不同的游戏机制和媒介的限制,以及创造独特事物的满足感。
- 人们应该带着批判性的品味和对媒介的理解来对待游戏开发。
Firefly - BEAM 语言的新编译器和运行时间
新闻
- Firefly 是一个用 Rust 编写的 BEAM 语言的编译器和运行时,可以编译针对 WebAssembly 的 Elixir 应用程序。
- Firefly 可以编译像 OTP 发布的可执行文件或库,但不管理依赖性。
- Firefly 由三个主要部分组成:编译器、库和运行时,并牺牲了一些功能以实现额外的优化
- 构建 Firefly 需要 LLVM 15,贡献者应在实施改变之前先与核心团队沟通。
- Firefly 不是为了取代 BEAM,可能缺乏必要的功能,但它提供了一个具有独特功能的 Erlang/OTP 的替代实现。
- 运行时的设计与 OTP 相同,但因所使用的 codegen 后端不同而不同,Firefly 使得用 Rust 实现的本地函数来扩展运行时变得容易。
- Firefly 的前身是 Lumen,在 Apache 2.0 下授权。
行业反应
- Firefly 是一个专门针对 BEAM 语言的新编译器和运行时,已经推出,重点是 WASI 编译和建立针对各种芯片组的独立二进制文件的能力。
- Firefly 的一个令人兴奋的方面是它有可能在微控制器上有效地运行 Elixir,同时保留其并发精神。
- BEAM 是支持几种编程语言的虚拟机,将 Lumen 项目改名为 Firefly 是由于多个类似名称的项目所必需的。
- 开发人员正在讨论 BEAM 运行时对 Elixir 的优化问题,有些人认为它围绕数学没有优化。
- BEAM 运行时专注于 I/O,性能围绕延迟设计,现在支持 JIT 编译,使用从头写起的 JIT,而不是 LLVM。
- Firefly 允许开发人员编译 Elixir 应用程序,以 WebAssembly 为目标,尽管在 Elixir 测试环境中操作 DOM 存在挑战,但这对于在前端运行 Elixir 是很有用的。
对准你的 Latents:用潜伏扩散模型进行高分辨率视频合成
新闻
- 一个团队开发了用于高分辨率视频生成的视频潜伏扩散模型(Video LDMs),在 512 x 1024 分辨率下实现了最先进的性能。
- 该模型使用时间注意力和三维卷积来实现高质量视频生成的微调解码器性能。
- 这种新方法还能够进行文本到视频的生成,为未来的内容创作铺设了令人兴奋的方向。
- 该团队表明,他们的方法的时间层可以推广到不同的微调文本到图像的 LDM。
- 这项研究由 Andreas Blattmann、Robin Rombach、Huan Ling、Tim Dockhorn、Seung Wook Kim、Sanja Fidler 和 Karsten Kreis 在 2023 年 IEEE 计算机视觉和模式识别会议上发表。
- 这项研究有可能在电影和娱乐业中发挥作用。
行业反应
- Nvidia 开发了一种高分辨率的视频合成方法,使用在视频数据集上训练的潜在扩散模型。
- 未来的视频生成可能会使用多模式、三维建模工具,这些工具通过基于扩散的过滤器得到完善。
- 使用体积表征和距离场的可差异化渲染器是视频场景离散化的潜在解决方案。
- 评论部分讨论了 "不思议谷 "的概念。
- Nvidia 训练了一个文本到视频的模型,能够生成逼真的驾驶场景,其运动的平滑度是前所未有的。
- 人们对该技术可能被滥用表示关切,并质疑该模型是否会向公众发布。
- 由于 "公地的悲剧",资金是一个挑战。
- 研究人员专注于视频模拟,以训练用于自动驾驶车辆的复杂人工智能模型。
NaturalSpeech 2:零距离的语音和歌唱合成器
新闻
- NaturalSpeech 2 是微软亚洲研究院和微软 Azure Speech 的一个新的 TTS 系统,它利用潜伏扩散模型来合成具有高表现力和强大的零距离拍摄能力的自然声音。
- 该系统的性能优于以前的 TTS 系统,与其他 TTS 系统相比,具有更高的语音质量、稳健性和 prosody/timbre 相似度。
- 该系统使用神经音频编解码器、残余矢量量化器和以文本输入为条件的扩散模型,这增强了零散能力。
- 微软在开发这项技术时表现出对负责任的人工智能原则的承诺。
- 在说话者模仿和语音欺骗方面存在着恶意使用的可能性,敦促从业者不要滥用该技术。
- 这篇文章强调了负责任地开发和使用人工智能技术的必要性,以及为检测人工智能合成的声音的工具进行辩护的重要性。