2023 年 4 月 20 日
StableLM: 一个新的开源语言模型
- StableLM 是一个为自然语言处理任务设计的新的开源语言模型。
- 该模型的独特之处在于,它允许用户在自己的特定数据集上进行训练和微调,从而提高特定任务的语言学习性能。
- 它的结构是基于 BERT 的,它的设计是为了尽量减少灾难性遗忘。
- 该模型在一个大型文本语料库上进行了预训练,包括维基百科和 Common Crawl。
- 该软件很容易使用,可以在 GitHub 上访问,并有文档帮助用户开始使用。
- StableLM 已经被用于各种应用,包括文本分类和情感分析。
- Stability.AI 发布了一个新的开源语言模 型,名为 StableLM,模型的参数范围从 3B 到 65B,上下文宽度为 4096。
- 模型评估受到了批评,但对于想要改进模型的开发者来说,这是一个很好的选择,因为它是开放源代码。
- StableLM alpha 模型正在测试中,预计将超过 Pythia 6.9B 的性能,并将在高达 1.5 万亿的标记上进行训练。
- 较大的模型学习速度更快,但容易过度拟合,企业让消费者为计算能力预先付费。
- 优化的 ML 框架在消费者硬件上越来越容易获得,但好的语言模型目前需要昂贵的 GPU,这使得云 API 成为唯一的选择。
- 通过 API 提供语言模型可以实现高度优化的推理,但本地计算可以在人工智能应用中实现更多隐私。
- 斯坦福大学的研究人员以开源许可的方式发布了 StableLM,这得到了不同的意见。
- 人工智能的发展和使用是热门话题,对超级智能人工智能接管世界的看法不一。
让 Linux 家庭服务器在空闲时睡觉,在需要时醒来--简单的方法
- 文章详细介绍了如何配置运行 Ubuntu Linux 的家庭服务器,使其在空闲时睡觉并按需唤醒,以托管 Time Machine 备份。
- 启用网络唤醒功能,通过单播数据包唤醒服务器。
- 网络服务,包括 ARP Stand-in 和 Avahi,被配置为在服务器睡眠时保持网络连接。
- 共享代码以确定空闲/繁忙状态,并通过一个 cron job 自动暂停到 RAM。
- 需要一个单独的永远在线的 Linux 设备和支持单播包的 Wake-on-LAN 的网络接口设备。
- ARP Stand-in 允许网络设备代表沉睡的服务器响应 ARP 请求,触发其唤醒。
- 作者使用 Ruby 和 libpcap 以及针对沉睡服务器 IP 地址的 ARP 请求包的过滤器来实现 ARP Stand-in。
- 解决了由 AFP 数据包和 NetBIOS 查询引起的不必要的唤醒问题。
- 文章解释了如何禁用 IPv6 并使用端口镜像来捕获来自服务器和网络其他部分之间的中间设备的数据包。
- Avahi 被作者用作 ARP 的替身服务。
- 作者使用 avahi-publish 来配置 Raspberry Pi。
- 作者创建了一个 systemd 服务定义,在启动时自动运行 avahi-publish。
- 一个多月来,设置一直很成功。
- Raspberry Pi 是低功耗服务器的一个流行选择,但一些用户建议用它来同步文件到一个 "真正的 "备份服务器,而不是按需设置。
- 关于低功耗服务器操作的建议包括使用 wifi 和配置以太网以实现低功耗操作。
- 建议使用其他迷你电脑,如 Beelink 和 Topton NAS 板。
- 建议使用 ChatGPT,以便更快地排除故障。
- 讨论了省电功能和围绕 "闲置 "定义的困难。
- 对局域网设置的唤醒和自我托管的备份与云服务的对比进行了辩论,以及对隐私和监控的关注。
- 读者分享了如何优化电力使用的技巧,如降低硬盘转速和使用高能效的电源。
- 讨论了 IPv6 技术及其好处。
- 讨论了尽量减少家庭服务器的电力使用的策略。
- ARP 欺骗可以用来唤醒沉睡的服务器。
用户: Junnn11
- 该帖子提供了各种古代节肢动物的重建和图解,包括 Euarthropods, Dinocaridids, lobopodians 等。
- 用户 Junnn11 是一位节肢动物爱好者,主要研究泛节肢动物的头部问题、跨节肢动物亚型和干系的系统发育、基底螯足动物、恐龙类和叶节动物。
- 帖子中列出了各种类型的福寿螺类、巨齿鲨类、吡咯咯类、突触类、恰斯马特类、有尾蛇类、蛛形纲等。
- 还有各种古代节肢动物的解释图。
- 该帖子提供了该用户的日本维基百科页面和 Twitter 账户的链接。
- 帖子中没有提到新的或最近的版本。
- Discussion Service 上的帖子展示了个人对利基学科的深入投入,包括技术、生物学和建模。
- 用户讨论了投资此类主 题的好处和坏处,包括对动机的影响和博士对自己兴趣的合法化。
- 用户 Junnn11 在维基百科页面上描绘节肢动物的生物力学和运动的插图,引发了关于生物学、遗传学和视觉概念的讨论。
- 用户还讨论了 "节肢动物的头部问题 "和用户设计偏好,如懒惰加载的图片。
- 在网页上默认加载标签是一个隐私问题,目前在 Safari 或 Firefox 中没有实现,而且可能会破坏一些网站。
- MediaWiki 应用程序是一个创建用户生成内容的 PHP 平台,Junnn11 在一个用户页面上的昆虫插图获得了关注。
- Y Combinator 正在接受 2023 年夏季的申请。
离线就是在线,有极强的延迟性
- 彼得-范-哈登伯格提倡本地优先的软件,程序在设备上运行,并利用云的 "耐久性或可及性",而不依赖它。
- 传统的企业级软件和云服务就像建造昂贵的航空母舰,而此时需要的是简单的、个人的、易于维护的工具。
- 在线和离线应该被认为是一个具有不同程度延迟的连续体。
- 离线只是延迟的最极端形式,它有自己的梯度,包括秒、分钟、小时、天,以及更多。
- 将在线/离线二元的想法转变为延迟的频谱,为构建不同的东西打开了新的 大门。
- 这篇文章讨论了离线与在线应用的概念,以及围绕它们是否应该被视为相同或不同的类别并有各自的要求的辩论。
- 对话深入探讨了悲观与乐观的用户界面以及数据定位与数据所有权。
- 在处理离线应用程序时,冲突解决是一个复杂的问题,解决方案应该被设计为同时处理在线和离线环境。
- 提出了向基于数据同步的产品方法的转变。
- 线下优先的体验必须被精心设计,将所有的东西都作为真理的来源,并处理模式和业务逻辑的迁移。
- 由于隐私和控制方面的考虑,一些用户喜欢点对点的应用,而不是基于互联网的服务。
- 方法的选择(本地 vs.基于云)取决于用户的需求和偏好。
- 讨论涉及到技术挑战,如 NAT 和发现系统,并讨论了潜在的解决方案,包括联合标准和网状网络。
- 提到了谷歌地图、iMessage 和天气应用等应用中离线容忍的重要性。
- 讨论集中在离线优先是否是协作工具的可行解决方案。
- 不同的评论者讨论了离线与在线通信的利弊以及弹性设计的重要性。
我的大部分技能现在一文不值,但有 10%的技能却价值 1000 倍