跳到主要内容

2023-09-16

我最喜欢的应用程序接口是欧洲中央银行网站上的一个压缩文件

  • 作者详细介绍了他们利用 csvbase(一个基本的网络数据库)从欧洲中央银行(ECB)提取和转换外汇汇率数据的方法。
  • 互动过程包括下载数据,使用名为 pandas 的软件库将其转换为更实用的格式,然后上传到 csvbase;随后使用 gnuplot 进行可视化,并通过 duckdb 进行复杂分析。
  • 文中着重强调了数据的开放性、简单易用性以及欧洲中央银行数据作为交换格式的有效性。

反应

  • 这篇帖子和线程的重点是欧洲中央银行的 zipfile API,它允许用户下载 CSV 文件,因其高效和可靠而备受赞赏。
  • 讨论提到了政府数据使用方面的困难和限制,并提出了数据管理和应用程序接口(API)设计效率低下的问题。
  • 与会者坚持认为,需要用户友好型的优化解决方案,并提出了各种有效存储和处理数据的工具、技术和数据格式。

我为 Uber 制作了 Excel,但他们弃用了它

  • 作者为 Uber 中国的一个名为 Crystal Ball 的项目开发了一个名为 R-Crusher 的自动化数据科学模型工具。
  • 尽管取得了成功,但该项目在 Uber 中国出售后终止,引发了人们对代码短暂性和提供商业价值重要性的反思。
  • 作者分享了软件工程界令人鼓舞的反馈意见,并提供了以前作品的链接,供读者进一步阅读。

反应

  • 讨论围绕经济和工业间谍、代码所有权、使用权、知识产权盗窃以及构建与购买软件工具的影响等问题展开。
  • 与会者从不同角度进行了辩论,一些人关注代码所有权的道德和法律影响,而另一些人则主张代码共享,并批评西方国家的虚伪。
  • 其中强调要了解雇佣协议并寻求法律建议,这表明科技领域的代码所有权和知识产权非常复杂,而且经常令人困惑。

家乐福在食品上发布 "缩水 "价格警告,令品牌蒙羞

  • 法国连锁超市家乐福推出了警告购物者 "缩水 "的标签,"缩水 "是指生产商缩小包装尺寸而不是提高价格。
  • 家乐福采取这一策略,在合同谈判之前向雀巢、百事可乐和联合利华等主要供应商施压。家乐福确定了 26 种产品采用这种做法,并计划如果供应商不同意降价,就贴上类似的标签。
  • 家乐福首席执行官亚历山大-邦帕尔批评这些公司没有考虑到原材料成本的下降而协助降低价格。

反应

  • 大型连锁超市家乐福正在给受 "通货紧缩 "影响的产品贴标签,以突出应对此负责的品牌。"通货紧缩 "是一种包装尺寸缩小而价格保持不变的现象。
  • 关于欧洲通货膨胀的争论一直没有停止过,人们一直在讨论通货膨胀究竟是企业虚增利润率的结果,还是供应链复杂化等其他因素造成的。
  • 讨论延伸到自然灾害中的哄抬物价、立法规范包装尺寸的效果、定价策略、收入不平等以及明确产品单位定价的必要性。

TikTok 因违反欧盟儿童账户数据法被罚款 3.45 亿欧元

  • TikTok 因违反有关儿童用户账户的欧盟数据法而被爱尔兰数据保护委员会(DPC)处罚 3.45 亿欧元(2.96 亿英镑)。
  • 违规行为包括将儿童账户默认为公共设置、在向儿童提供数据信息时缺乏透明度、允许成人访问儿童用户账户以及疏于评估未成年用户的风险。
  • 在此之前,TikTok 还因未经父母同意非法处理 140 万名 13 岁以下儿童的数据而被英国数据监管机构罚款 1270 万英镑。

反应

  • TikTok 因违反有关儿童账户的数据保护规定而被欧盟罚款 3.45 亿欧元。
  • 这一决定之后,围绕罚款作为惩戒措施的效力、隐私法的执行以及科技公司保证数据安全的义务展开了辩论。
  • 有些讨论偏离了主题,深入到欧盟对希腊金融危机的处理和难民局势--这些问题与主要新闻没有直接关系。

秋吉的幻象页面

  • 北冈明吉开发的网站汇集了各种幻觉图像和设计,并附有解释和背景资料。
  • 除核心内容外,网站还提供与光学幻象主题相关的新闻、竞赛和照片。
  • 使用限制已经到位,特别是禁止商业应用,并警告用户这些内容可能会引起头晕。

反应

  • 文章讨论了北冈明吉最近的一个幻觉,展示了人们对彩色圆环的不同感知,眼镜和头部运动等变量都会影响效果。
  • 论坛参与者分享个人经历,讨论光学幻觉对大脑的影响,探索更广阔的幻觉艺术领域。
  • 该书强调了幻觉在广告和游戏等领域的潜在用途,突显了人们对光学幻觉的持续痴迷。

从零开始打造经济模拟器

  • 作者正在从头开始创建一个模拟经济,并记录他们的进展。
  • 它们从单一实体开始,引入有关资源利用和生产的理论,并逐步吸收更多专门从事水生产的工人。
  • 他们引入了货币作为共享资源的核算机制,为其模拟提供了一种有趣的动态。

反应

  • Hacker News 的讨论重点是创建一个经济模拟器,并探讨其与经济学、心理学和真实世界数据之间的关系。
  • 与会者强调了对复杂的经济系统进行准确建模和模拟所面临的挑战,并强调了纳入真实世界数据以及考虑不良行为者和利用情况的重要性。
  • 辩论还涉及资本主义经济体系之外的资本家的存在和作用。讨论强调了财富集中和经济模式局限性等关键问题。

通货紧缩跟踪器

  • Shrinkflation.io 是一个旨在打击 "通货紧缩"(shrinkflation)的网站。"通货紧缩 "是一种产品尺寸缩小而价格不变的现象。
  • 该网站保留了不同产品和品牌的搜索记录,其中包括吉百利(Cadbury)牛奶、玛氏(Mars)麦芽糖和雀巢(Nestlé)Kit Kat。
  • 用户可以直接从网站上监测这些产品和品牌。

反应

  • 黑客新闻论坛围绕 "通货紧缩 "展开各种讨论,重点关注其对产品质量的影响、企业的欺骗行为、对透明度和改进标签的要求,以及相关的道德困境。
  • 其他议题包括追踪缩水商品的机制、与动物试验有关的问题,以及垃圾食品的可负担性和对健康的影响。
  • 通货紧缩指的是企业在维持或提高价格的同时缩小产品尺寸或数量的过程,通常不会明确告知消费者。

Kopia快速安全的开源备份软件

  • 该网站介绍了一款开源备份软件 Kopia,该软件速度快、安全性高,并可通过 GUI(图形用户界面)和 CLI(命令行界面)与多种操作系统兼容。
  • Kopia 可使用用户首选的云存储进行加密、压缩和重复备份,并提供一个桌面应用程序来管理快照、策略和文件恢复。
  • 网站通过 GitHub 上的 "拉取请求"(Pull Request)工作流程邀请用户为 Kopia 投稿和报告错误,并在 Slack 上让用户讨论 Kopia 的功能和问题。

反应

  • Kopia 是一款快速、安全的开源备份软件,但由于存在存储不正确和发布更新缓慢等缺点,目前正在讨论之中。
  • 用户在使用 Kopia 时遇到了一些问题,包括无法完成备份、进度指示器不准确以及恢复大型数据集时出现问题。
  • 会议还讨论了 Kopia 的替代方案、离线备份的优势以及在企业环境中对备份服务进行全面测试的必要性。

Linux 如何启动进程

  • 文章深入探讨了 Linux 启动进程和准备执行堆栈的机制,尤其是进程调用 execve() 时的情况。
  • 它使用 gdb(GNU 调试器)分析指令和程序堆栈,深入检查二进制文件的细节。
  • 这篇文章还说明了 Linux 内核如何分配和填充堆栈信息,包括参数列表和环境变量,为 "Zapper "等工具提供了有用的见解。

反应

  • Hacker News 上的讨论主题主要是了解 Linux 如何启动进程以及 ELF(可执行和可链接格式)头的解释。
  • 为进一步深入学习这一主题,还分享了多种资源和参考资料。
  • 部分讨论包括对主题中其他用户分享的评论和信息的质量进行批评和反馈。

谷歌将就欺骗性定位追踪支付 9,300 万美元和解费

  • 谷歌(Google)被指控在位置跟踪做法上误导消费者,已同意支付 9,300 万美元达成和解。
  • 加州总检察长提起诉讼,指控谷歌继续收集和存储用户位置数据,即使用户禁用了定位历史记录。
  • 和解协议还包括要求谷歌提高跟踪方法的透明度,并在更改隐私设置前征得同意的条款。

反应

  • 谷歌已同意就欺骗性位置跟踪行为的指控达成一项 9,300 万美元的和解协议,但考虑到谷歌的年收入,该和解协议被批评为不足以防止未来的违规行为。
  • 关于是否有必要采取更严格的惩罚措施和立法来保护隐私的讨论,以及对谷歌的互联网主导地位和和解补救措施的有效性的批评正在出现。
  • 有人对位置历史记录设置的复杂管理、某些应用程序未经允许更改设备设置以及激活位置跟踪需要谷歌账户等问题表示担忧。

"反向疫苗 "显示出治疗多发性硬化症和其他自身免疫性疾病的潜力

  • 芝加哥大学普利兹克分子工程学院的研究人员发明了一种 "反向疫苗",有可能治愈自身免疫性疾病,包括多发性硬化症和 I 型糖尿病。
  • 传统疫苗训练免疫系统识别和对抗病毒或细菌,而这种新型疫苗则消除了免疫系统对特定分子的识别,避免了自身免疫反应。
  • 这种 "反向疫苗 "利用肝脏的程序将恶化细胞中的分子标记为 "不攻击 "标签。初步实验室测试表明,这种疫苗能有效逆转与多发性硬化症有关的自身免疫反应,安全性试验已经开始。

反应

  • 芝加哥大学的研究人员开发出一种 "反向疫苗",旨在通过消除免疫系统对问题分子的记忆来治疗自身免疫性疾病。
  • 这种疫苗为目前的免疫抑制疗法提供了一种更精确的替代方法,有望取得更有效的效果。
  • 人们对潜在的副作用以及对自身免疫疾病的更广泛了解仍存在担忧。天花疫苗的作用和保持免疫力的意义也在争论之中。

加利福尼亚州通过法案,使从数据经纪商处删除数据变得更容易

  • 加州立法机构通过了《删除法案》,该法案旨在简化消费者从数据经纪商处删除个人信息的程序。
  • 加州隐私保护局将负责建立一个系统,让消费者只需一次申请就能要求数据经纪商删除他们的记录,从而提高个人数据的透明度和控制权。
  • 一些企业和行业协会对该法案表示反对,认为可能会产生意想不到的后果,并可能对小企业造成损害。该法案目前正等待州长的批准。

反应

  • 加利福尼亚州通过了一项立法,重点是赋予个人从数据经纪商那里轻松删除其数据的权利,尽管该立法豁免了谷歌和 Facebook 等已经有义务应要求删除数据的公司。
  • 该法案的主要目标是加强个人数据控制和隐私保护,但也有人对其有效性和特定企业的豁免问题表示担忧。
  • 讨论还介绍了数据销售、信用评分和现有法规的有效性等话题。还进一步探讨了《加州消费者隐私法案》(CCPA)及其影响、潜在漏洞和数据删除的复杂性。该法案要求各机构建立删除机制,并对违规行为进行处罚。

Instagram 如何在仅有 3 名工程师的情况下将用户数量扩大到 1400 万

  • Instagram 实现了大幅增长,在一年多一点的时间里,用户数量就达到了 1400 万,而当时的小团队只有三名工程师。
  • 为此,他们采用了三项指导原则和可靠的技术堆栈,包括 AWS、Ubuntu Linux、EC2、NGINX、Django、Gunicorn、Postgres、S3、Redis、Memcached、pyapns 和 Gearman 等技术。
  • 他们还利用 Sentry、Munin、Pingdom 和 PagerDuty 等监控工具来确保基础设施的有效性和可靠性。

反应

  • 文章介绍了 Instagram 在仅有三名工程师的小团队中将用户数量扩大到 1400 万的惊人壮举,说明了初创企业小团队规模的潜在效率。
  • 报告重点介绍了 Instagram 简单而有效的架构,并讨论了在应用程序开发中使用微服务的好处和挑战。
  • 文中还深入探讨了扩展数据库和 Instagram 数据库架构的实际意义,并提到了 Roblox 在实施微服务时面临的挑战。

Subdomain.center - 发现域的所有子域

  • 子域中心是 ARPSyndicate 开发的一个研究项目,它利用 Apache 的 Nutch 和 OpenAI 的 Embedding Models 等工具发现了比其他任何服务都多的子域。
  • 为避免滥用,该服务限制用户每分钟最多只能提出三个请求,而且由于需求增加,可能会出现停机。
  • 除子域中心外,ARPSyndicate 还提供命令行实用工具 Puncia 以及与漏洞观察、攻击面管理、漏洞扫描和开源情报有关的其他资源。

反应

  • 论坛讨论了与子域相关的漏洞和风险,用户分享了不同的发现方法,如扫描 IPv4 互联网、利用证书透明度日志和使用专有工具。
  • 有人担心公开子域的隐私和安全问题,以及确保内部子域安全的难度,建议在打开端口和暴露服务时谨慎行事,以提高安全性。
  • 建议实施端口锁定或使用 Tor 来增强安全性,以及在这些情况下使用 IPv6 而不是 IPv4 的优势。

是的,Android 14 仍然允许修改系统证书

  • 这篇博文对蒂姆-佩里(Tim Perry)关于 Android 14 限制对系统证书进行所有更改的说法提出了质疑,并提供了仍然可以进行调整和用户可以撤销系统证书信任的证据。
  • 作者声称,开发人员可以通过 ADB(安卓调试桥接器)添加受信任的系统证书,这是一种通用的命令行工具,用于与运行安卓系统的设备进行通信。
  • 在承认安卓 14 带来的变化的同时,我们得出结论,用户的自由得到了保留,这些变化有助于对证书存储进行空中更新,从而意味着有望更新为与安卓 14 兼容的工具。

反应

  • 讨论重点是 Android 14 的系统证书修改以及 root 设备的影响和潜在好处,包括以牺牲其他功能和应用程序为代价获得某些功能和应用程序。
  • 用户正在评估其他方法,如 ADB + Frida 或 Magisk + safetynet-fix,以进行修改,并在用户自由与设备保护之间取得平衡。
  • 面对安卓和苹果设备日益增长的敌意,这篇文章强调了用户所有权的重要性。它赞扬了苹果公司的安全措施,同时建议在开发者模式中加入警告。

美国诉 Google 案的第一周--默认就是一切,没有人喜欢必应

  • 美国政府已开始对谷歌进行反垄断审判,指控这家科技巨头通过强力交易而非公平竞争来确立其搜索引擎市场的主导地位。
  • 此案将围绕谷歌为维持其垄断地位而采取的涉及违约和数据使用的做法展开,同时还将审查这些行为是有利于消费者还是只符合谷歌的利益。
  • 审判将探讨谷歌的主导地位对消费者和广告商可能造成的伤害,而法官裁决的关键将取决于搜索引擎等免费产品是否真的会对消费者造成伤害。

反应

  • 美国诉 Google 案的审判调查了付费成为默认搜索引擎是否违反竞争规则,旨在制定更明确的准则。
  • 批评者认为,员工声明被滥用,转移了对真正反竞争行为的关注。提出的主要担忧是谷歌的主导地位、缺乏有效竞争以及对其他搜索引擎(如必应和 Mozilla)的影响。
  • 用户对当前的替代方案表示不满,要求提供更好的搜索引擎选择。其他讨论的话题还包括互联网使用、Chromium 的独立性以及 Mozilla 的财务可行性。

如何使用位级魔法在 26 个字节中存储国际象棋位置 (2022)

  • 文章介绍了一种用 26 个字节紧凑存储国际象棋位置的创新技术。
  • 该方法利用王和兵的独特位置来表示吃子、攻城能力和过河目标,同时对晋级进行独特编码,从而减少了必要的存储空间。
  • 这种存储技术包括使用位图和排序来有效地描述位置的不同方面,从而使国际象棋位置的存储空间仅为大约 26 个字节。

反应

  • 文章深入探讨了更紧凑、更高效地压缩和存储国际象棋位置的方法,以减少数据需求,同时保留关键信息。
  • 它涵盖了各种策略,如比特级魔法、区块链技术的使用、存储走棋历史、内存调用和专门针对国际象棋引擎的紧凑编码。它还强调了压缩格式相对于 JSON 格式的优势。
  • 目的是提高国际象棋数据库和应用程序的性能、存储和处理效率。

游戏开发者书籍

  • 这篇文章详细列出了向游戏开发者推荐的书籍,涵盖了与该领域相关的众多主题。
  • 这些书籍为计算机制图、游戏编程、人工智能以及物理和动力学模拟提供了宝贵的见解。
  • 这几卷中涵盖的其他主题还包括设计与应用、线性代数、优化和算法,为有抱负和经验丰富的游戏开发人员提供了全面的知识基础。

反应

  • 论坛讨论围绕游戏开发书籍集展开,其中包括进一步阅读的建议。
  • 其中有一部分是对一位受人尊敬的已故游戏开发者的悼念和追忆,表明了他在该领域的影响力。
  • 讨论的重点是四元数;用户发现四元数是一种复数系统,在游戏开发中可用于表示 3D 旋转。

约翰尼-卡什无处不在(人)

  • 在 2012 年伦敦音乐黑客日期间,Iain Mullan 利用 MusixMatch、Toma.HK 和 Covers FM 创造了一个以约翰尼-卡什的歌曲 "I've Been Everywhere "为主题的创新黑客。
  • 黑客通过一张地图,展示了传奇艺术家约翰尼-卡什(Johnny Cash)在其歌曲中描述的旅行地理跨度。
  • 利用谷歌和国家地理和信息科学研究所的地图数据,这种创造性的地理表现形式得以可视化。

反应

  • 文章重点介绍了一个名为 "Johnny Cash Has Been Everywhere (Man) "的网站,该网站列出了约翰尼-卡什的歌曲 "I've Been Everywhere "中提到的所有地点。
  • 文章中的用户讨论围绕相关主题展开,包括提及的目的地之间的最短路径。
  • 讨论还涉及约翰尼-卡什的毒瘾问题等个人话题。

从数据集角度优化 LLM

  • 文章探讨了利用精心挑选的数据集进行微调来优化大型语言模型(LLM)的策略。
  • 报告详细介绍了在 LIMA 数据集上对 7B 参数语言模型进行指令微调的过程,并提到了自动质量过滤的潜力。
  • 文章还提到了 "NeurIPS LLM 效率挑战赛",并强调了 LLM 生成的数据集和人工编辑的数据集的重要性。

反应

  • 这篇文章探讨了通过利用大型语言模型(LLM)来制定更小的高质量数据集,从而完善大型语言模型(LLM)的概念。
  • 这一过程需要在各种数据上训练一个广泛的模型,利用它将源数据提炼成未经玷污的数据集,然后在这些数据集上训练较小的模型。这样做的目的是为了开发出更易于使用、推理速度更快、可能不涉及版权问题的模型。
  • 此外,还讨论了增强 LLM 智能的其他技术,如检索增强生成(RAG)和利用微调数据集进行语言翻译。