跳到主要内容

09

2023 年 7 月 9 日

当一个应用程序要求权限时,它应该有一个 "馈送假数据 "的选项

  • 当一个应用程序要求获得权限时,用户应该有一个选项,即提供虚假数据,而不是授予完全的访问权。
  • 这种方法将允许用户保护他们的个人信息,同时仍然能够使用该应用程序。
  • 通过提供虚假数据来积极惩罚服务,可能比抵制它们更有效。

行业反应

  • 关于用户对其数据的控制、应用程序权限的影响以及应用程序开发商和设备制造商对透明度和问责制的需求的持续辩论。
  • 对隐私和用户自主权的关注,以及未来新发展的潜力。
  • 关于在 App Store 上实施地区本地化的讨论,对当前系统的不满,以及对替代解决方案的建议。

如果 PEP 703 被接受,Meta 可以承诺为无 GIL 的 CPython 提供三年的工程师年限

  • 语句 "pmf = sum(counters) # 这样做有用吗? 不记得了",如果提供了一个初始的空 Counter,就会有效。
  • 如果没有一个初始的空 Counter,该语句将从 0 开始,并引发一个错误。
  • 这一信息对于理解如何在编程中正确使用该语句是有意义的。

行业反应

  • PEP 703 如果被接受,可能会导致 CPython 中全局解释器锁(GIL)的移除,提供更好的并行性和性能。
  • 过渡到无 GIL 的 Python 将需要重建和更新 C-API 扩展,这对严重依赖它们的代码库来说可能是一项重大的工作。
  • Facebook (Meta)已经承诺投资工程师年来改进 Python 解释器,使之有可能禁用 GIL。

软件工程师讨厌代码

  • 软件工程师通常不喜欢与代码打交道,尤其是由他人编写的代码。他们更喜欢那些需要最少维护和故障排除的绿地项目。
  • Stack Overflow 是一个受欢迎的资源,可以在不进行大量代码分析的情况下找到代码解决方案。
  • 高级工程师优先考虑尽量减少不必要的代码和删除现有的代码,理解代码会产生维护和风险。他们主张改进和重复使用现有的代码,而不是创造新的解决方案。

行业反应

  • 软件工程师通常不喜欢处理现有的代码,因为它可能很复杂,难以理解。
  • 在编写新代码和处理现有代码之间取得平衡是很重要的,要考虑到维护现有代码的预计成本和重建的潜在好处。
  • 优秀的工程师应该对自己的工作感到自豪,努力编写干净和可维护的代码,并理解编写高质量代码的长期好处。

Langchain Is Pointless

  • Langchain 是一个流行但设计不良的语言模型工作库。
  • 它充满了重叠的抽象概念,导致了混乱和挫折。
  • 文档杂乱无章且不一致,使其难以有效使用。

行业反应

  • Langchain 被批评为试图在不适合的技术基础之上解决问题。
  • 用户发现,Langchain 中每个功能所需的自定义提示和提示调整都不能重复使用,导致输出结果不理想。
  • 许多开发者发现,使用更简单的方法和库构建自己的解决方案,而不是使用 Langchain 的抽象,效率更高。

我不再购买新的笔记本电脑(2020 年)

  • 作者解释了为什么他们不再购买新的笔记本电脑,而是改用 2006 年的二手机器,花的钱大大减少。
  • 不买新的笔记本电脑不仅可以省钱,还可以减少与笔记本电脑生产相关的资源消耗和环境破坏。
  • 作者提供了一些提示,说明如何通过使用低能耗软件和用固态硬盘替换硬盘驱动器,使旧的笔记本电脑像新的一样运行。

行业反应

  • 这篇文章探讨了围绕消费主义和每年购买新技术的压力的辩论。
  • 它讨论了这些购买背后的心态以及它们是否值得花钱。
  • 该文章提到了更换电池,并引用了一段关于笔记本电脑电池寿命的视频。

通过实践学习电子产品

  • 这篇题为 "通过实践学习电子产品 "的帖子是为那些有兴趣通过实践学习电子产品的人而写的。
  • 该帖子提供了一种学习电子学的实用方法,对刚进入该领域的初学者特别有用。
  • 读者可望通过本帖提供的逐步指导和实际例子,获得宝贵的电子学知识和技能。

行业反应

  • 讨论服务主题讨论了通过实践学习电子学的经验。
  • Nand2tetris 被提到是学习电子的推荐课程。
  • 该文章被批评为在解释复杂概念时文笔不佳。
  • 分享了一些学习电子学的资源,如书籍、视频和网站。
  • 文章提到了一些套件,如 Ben Eater 的 8 位计算机套件,这些套件是学习电子学的理想选择。
  • 强调了理解数字和模拟电子技术的重要性。

PdfGptIndexer: 使用 GPT-2 和 FAISS 对 PDF 文本数据进行索引和搜索

  • PdfGptIndexer 是一个工具,可以帮助你使用先进的 AI 模型快速查找和搜索 PDF 文档中的信息。
  • 它使用 Textract、Transformers、Langchain 和 FAISS 等库,以一种紧凑而有效的方式处理和存储文本数据。
  • 将文本嵌入存储在本地可以加快检索过程,允许离线访问,节省计算资源,并能处理大型数据集。

行业反应

  • 用户对类似应用使用 OpenAI 或云服务的要求感到沮丧。
  • 这些应用的默认方法应该是本地优先,如果需要,可以选择使用云服务。
  • 有一些可供选择的方案,比如本地运行的 LLM,可以提供类似的功能,而不需要使用云服务。
  • 一些用户对在自己的硬件上本地运行 LLM 感兴趣,但正在寻找关于如何有效运行的指导。
  • OpenAI 的定价和数据使用政策是一些用户关心的问题,他们出于隐私原因正在探索其他选择。
  • 有几个开源工具和库可用于构建和定制 LLM,如 txtai 和 ChatGPT。
  • 用户正在寻找允许他们从自己的文件和数据中搜索和获取信息的解决方案。
  • 人们在讨论使用人工智能模型和云服务的隐私问题,特别是对个人和敏感数据的隐私问题。
  • 一些用户对与人工智能模型和技术相关的认证和资格感兴趣,而另一些用户则认为没有价值。
  • 在微调和矢量搜索领域有一些竞争性的选择和初创公司,为 OpenAI 提供了替代方案。
  • 用户正在讨论不同嵌入模型的优势和限制,如 GPT-2、GPT-4 和自定义嵌入。
  • 用户还在探索使用其他工具和库,如 Milvus、Quickwit 和 Pinecone,进行矢量存储和搜索。
  • 人们对使用人工智能模型来搜索和分析个人数据感兴趣,如电子邮件和聊天记录。
  • 隐私和数据安全的重要性得到了强调,人们对第三方访问个人和敏感信息表示担忧。
  • 用户对寻找提供人工智能能力的数据分析和检索的托管版本和服务感兴趣。
  • 使用人工智能模型索引和搜索数据的潜在用例被讨论,如组织笔记、检索信息和生成摘要。
  • 对不同的人工智能模型和嵌入的有效性和可靠性进行了辩论,包括 GPT-2、GPT-4 和其他。
  • 用户正在分享他们在不同硬件配置(如英特尔 Mac)上本地运行人工智能模型的经验和建议。
  • 强调了开源替代方案和库的可用性,如 privateGPT 和 vlite。
  • 讨论了使用人工智能模型进行文档搜索和个人知识管理的好处,包括增强检索和总结能力。
  • 提出了对人工智能模型的滥用和潜在滥用的担忧,包括医疗信息和隐私的侵犯。
  • 一些用户对缺乏关于人工智能模型的硬件要求和性能基准的文件和信息表示失望。
  • 用户分享了他们使用人工智能模型的不同工具和方法的经验,例如允许与文件和嵌入物进行私人互动的服务。

年度恐怖游戏是 Doom II Mod

  • MyHouse.wad,一个 Doom II mod,被其崇拜者誉为年度最佳恐怖游戏。该 MOD 引入了以前认为在《毁灭战士 II》中不可能实现的新技术和功能。
  • 该 MOD 是由一个名为 Veddge 的神秘用户创建的,他留下了神秘的信息,在发布后不久就消失了。这引发了玩家的狂热,他们渴望揭开这个 MOD 的秘密以及它与 Veddge 的个人经历的联系。
  • 该游戏令人不安的气氛和令人费解的玩法使其成为一种独特的、令人难忘的恐怖体验,获得了玩家和业界专业人士的赞扬,包括《毁灭战士》设计师约翰-罗梅罗和作者马克-丹尼尔维斯基。

行业反应

  • "年度恐怖游戏是《毁灭战士 II》MOD"
  • 按照步骤和下载必要的文件来玩这个游戏
  • 阅读辅助材料和论坛帖子可以增强体验
  • 关卡可能需要一段时间来加载,但不要惊慌
  • 如果你是 Silverblue 的用户,你可以从 GZDoom 的 Flatpak 中启动游戏
  • myhouse.wad 文件并不包含完整的关卡,你需要使用 myhouse.pk3 文件。
  • 这个 MOD 是一个惊悚片,而不是一个恐怖游戏
  • 游戏中有一些秘密和隐藏内容,可能需要外部资源才能发现。
  • 该模型的灵感来自于《叶子的房子》一书,但它们是不同的故事。
  • YouTube 上有几个视频,介绍了内容和创建 MOD 的方法。
  • 有些人觉得恐怖游戏太过激烈,但这个 MOD 很有趣,却不吓人
  • FPS 游戏对一些玩家来说可能会变得重复和过于紧张
  • 有人希望游戏中有更多非战斗机制的可能性
  • 该 MOD 因其艺术性和创造性而受到称赞
  • 对于那些有兴趣探索更多选择的人,还提到了其他的 Doom mods
  • 设置和播放 MOD 的过程可能需要下载额外的文件并将其复制到特定的文件夹中。
  • 可以选择获得必要的游戏文件,如购买 Doom II 或使用 Freedoom 项目。
  • 该 MOD 具有广泛的吸引力,吸引了不同的观众
  • 游戏被高度期待,并在玩家中产生兴奋感
  • 该 MOD 使用了原版 Doom 引擎中不可能实现的功能。
  • 游戏因其对细节的关注和令人不安的气氛而受到赞扬。
  • 对于那些不熟悉原版《毁灭战士》游戏的人来说,该 MOD 可能不具有吸引力。

为什么使用 Pascal?

  • Pascal 是一种现代的、可读的、快速的编程语言,可以用来开发可维护的应用程序。
  • 它是跨平台的,这意味着它可以用来为不同的操作系统和设备创建软件。
  • 帕斯卡有一个欢迎和支持的社区,有广泛的工具和库供开发人员使用。

行业反应

  • 这篇文章讨论了 Pascal 的使用,这是一种古老的编程语言,仍然有忠实的拥趸。
  • Lazarus 是 Delphi 的一个开源再造版,被提到是 Pascal 的一个流行的 IDE。
  • FpcUpDeluxe 工具被介绍为一种自动安装 Pascal 集成开发环境和附加模块的方法。

骗局不断:数据驱动的广告诈骗

  • 数字广告充满了骗局和欺骗性的做法,多层骗局叠加在一起。
  • 数据驱动的广告,声称使用个人信息来准确定位广告,但在定位方面往往失败,用不相关的广告轰炸个人。
  • 科技公司拥有大量的用户数据,但他们的算法不够成熟,无法做出准确的预测或向广告商提供有意义的见解。因此,广告商被卖给了一个错误的承诺,最终导致无效的广告活动。

行业反应

  • 作者认为,数据驱动的广告是一个骗局,并质疑定向广告和算法的有效性。
  • 他们强调了广告商和他们的目标受众之间的脱节,并认为广告业专注于销售服务而不是推动销售。
  • 作者强调了质疑数据驱动的广告有效性的重要性,并强调需要进行更严格的测试和分析。