每日HackerNews RSS

## 人工智能营销 BS 指数 受物理学中“谬误指数”的启发,Bastian Rieck 提出一个“人工智能营销 BS 指数”,用于评估在人工智能产品被过度炒作的时代,营销材料的可信度。该指数旨在识别并评估过于热情或具有误导性的说法。 从 -5 分(给予信任)开始,得分会因以下行为而增加:无正当理由创造术语(+10 分),错误使用科学术语(每次 +10 分),以及使用“这不是 X,而是 Y”之类的修辞手法(+20 分)。 更高分数会授予以下行为:援引“自然”或“宇宙” (+20 分),无根据使用“涌现属性” (+20 分),炫耀常春藤盟校 (+20 分),缺乏可证伪的主张 (+30 分),以及无法验证的研究合作 (+40 分)。 该指数仍在完善中,旨在帮助过滤掉空洞的营销“氛围检测”,并识别真正有价值的人工智能创新。

对不起。

## git-bayesect: 贝叶斯Git二分查找 `git-bayesect` 是一个用于识别引入事件发生概率变化的提交的工具(例如,不稳定的测试)。与传统的 `git bisect` 不同,它使用贝叶斯推理,只需要一个变化*已经*发生,而不需要精确的失败率。 它通过迭代地缩小可能的提交范围,基于最小化预期熵来选择下一个要测试的提交。该工具巧妙地使用 Beta-Bernoulli 共轭性来处理未知的失败概率。 **关键命令:** * `git bayesect start --old <COMMIT>`:开始二分查找。 * `git bayesect pass --commit <COMMIT>`:记录一次成功的测试。 * `git bayesect prior --commit <COMMIT> --weight <value>`:设置关于某个提交的先验信念。 * `git bayesect run <command>`:使用给定的命令自动化测试。 你还可以基于文件名或提交消息/diff内容设置先验概率,以获得更准确的结果。提供了一个演示仓库和脚本来帮助你入门。

## Git Bayesect:贝叶斯二分查找用于间歇性错误 - 摘要 Git Bayesect 是一种新工具,旨在高效地识别引入非确定性(间歇性)错误的提交,这对于传统的 `git bisect` 来说是一个挑战。与需要一致复现的 `git bisect` 不同,Bayesect 使用贝叶斯推理来处理可变错误的发生情况。 基准测试表明,在存在间歇性的情况下,Bayesect 显著优于 `git bisect`——在 90/10 的间歇性下,Bayesect 实现了约 96% 的准确率,而 `git bisect` 降至约 44%。通过基于代码结构对先验进行加权,优先考虑影响高度连接函数的提交,还可以获得进一步的准确率提升(10-15%)。 该工具通过策略性地选择下一个要测试的提交,最大限度地提高信息增益,从而最大限度地减少测试运行次数。虽然并非完全最优,但它为调试间歇性问题提供了实质性的改进,尤其是在测试缓慢或涉及 LLM 交互等外部因素时,这一点非常有价值。该项目在 GitHub 上可用 ([https://github.com/hauntsaninja/git_bayesect](https://github.com/hauntsaninja/git_bayesect)) 并且正在集成到 sem 中 ([https://github.com/ataraxy-labs/sem](https://github.com/ataraxy-labs/sem))。

## SwiftLM:快速原生 MLX 推理服务器 SwiftLM 是一款高性能、原生 Swift 推理服务器,专为 Apple Silicon 设计,用于运行 MLX 模型,并提供与 OpenAI 兼容的 API。它消除了 Python 和全局解释器锁 (GIL) 的开销,从而实现闪电般的速度。 主要特性包括直接加载 HuggingFace 模型并使用 Safetensors 解析,以及集成的 TurboQuantization——一种混合量化技术,在显著压缩内存(KV 缓存高达 3.5 倍)的同时,几乎没有精度损失。一项实验性的 SSD 流式传输功能允许通过直接从 NVMe SSD 交换 MoE 层到 GPU 来运行大型模型(122B+ 参数)。 SwiftLM 提供精细的内存控制,并包含用于设备端推理的原生 iOS 应用程序。它在 Apple M 系列芯片上进行了基准测试,并优先考虑稳定性,避免了可能导致系统崩溃的大型模型问题。它提供预构建的二进制文件以供快速设置,并支持标准的 OpenAI API 端点。

Unicode字符超出基本多文种平面(BMP)需要不同的UTF编码处理方式。UTF-8和UTF-32使用4字节序列直接映射码点来表示这些字符,而UTF-16则采用“代理对”系统。 由于UTF-16使用16位“码元”(最大值65,535),无法直接表示更高的码点。相反,它利用两个保留范围——高代理和低代理——来*表示*这些字符。一个补充字符被编码为一个高代理*后跟*一个低代理的组合。 这些代理对应始终一起出现,并且在文本处理期间(换行、高亮显示、计数)不得拆分。您不会在UTF-8或UTF-32编码中找到单个代理或这些对。本质上,UTF-16使用这种解决方法来在其16位结构内表示完整的Unicode字符范围。

对不起。

## 美国贫困率出乎意料地高,尽管经济在增长 传统的经济衡量标准在比较贫困水平时可能具有误导性。牛津经济学家奥利维尔·斯特克开发了“平均贫困”——即赚取1美元(按购买力调整)所需的平均时间——以提供新的视角。他的研究表明,尽管平均收入较高,美国经历的“平均贫困”比大多数西欧国家*显著*更高。 目前,在美国赚取1美元需要63分钟,大约是德国(26分钟)、法国(31分钟)和英国(34分钟)所需时间的两倍。虽然美国最贫困的州密西西比的人均GDP与德国相当,但美国不断上升的收入不平等意味着更大比例的人口正经历严重的经济压力。 斯特克的数据显示,自1990年以来,美国的“平均贫困”实际上在*增加*,即使经济在增长,也是因为不平等现象超过了收入增长。相反,收入分配更稳定的欧洲国家已经看到“平均贫困”有所下降。这表明,经济增长本身并不能保证减少贫困;财富的分配方式至关重要。

## 人工智能的隐藏成本:在不知情的情况下多付钱 人工智能公司正在悄悄地通过按*token*(子词单元)收费,而不是按词收费来抬高用户成本。这个看似微小的细节导致了显著的价格差异,相同的请求根据供应商(OpenAI、Google、Anthropic等)的不同,成本可能高出高达60%。 核心问题是:**token缺乏标准化。** 每家公司使用自己的“tokenizer”(将文本分解为token的系统),导致对相同内容token数量的计算不同。这对于非英语语言影响尤其大,例如印地语和阿拉伯语,由于训练数据存在偏差,token成本比英语高*四到五倍*。 目前,价格差距巨大——截至2026年3月,最便宜和最昂贵的模型之间高达420倍。这种不透明性类似于早期的云计算,供应商使用不可比的计算单位。 **TokensTree** 旨在通过提供跨供应商的token记账和“SafePaths”(缓存解决方案,可减少冗余计算并规范token成本)来解决这个问题,最终促进一个更透明、更高效的人工智能经济。他们旨在使token使用更加公平和环保。

对不起。

Meta 正在利用人工智能彻底改变美国的混凝土生产,旨在提升国内制造业、可持续性和效率。目前,美国大约进口 20-25% 的水泥,这影响了就业并阻碍了对美国标准的遵守。Meta 的新型人工智能模型 **Bayesian Optimization for Concrete (BOxCrete)** 加速了传统上缓慢且昂贵的混凝土配比设计过程。 BOxCrete 智能地探索配方,从数据中学习,以推荐满足强度、成本和可持续性目标的混合物——特别是利用国内采购的材料。成功的应用包括在 Meta 位于明尼苏达州罗斯芒特的的数据中心使用的更坚固、更快固化的混凝土,强度提升速度快 43%,并减少了裂缝。 Meta 已经将 BOxCrete 作为开源软件发布在 GitHub 上,合作伙伴如 Amrize(一家大型水泥生产商)和 Quadrel(一家混凝土行业软件提供商)已经将其整合到他们的工作流程中。该举措支持将制造业迁回国内的趋势,为自 2020 年以来恢复的超过 110 万个美国就业岗位做出贡献,并加强了价值 1300 亿美元的混凝土行业。Meta 的长期愿景是行业范围内向人工智能驱动的配比设计转变,以实现更具弹性和可持续性的未来。

## 混凝土AI:摘要 Meta发布了一种AI模型,名为混凝土贝叶斯优化(BOxCrete),旨在改进混凝土配比设计,尤其利用美国生产的材料。目标是加速寻找最佳混凝土配方的过程,解决材料可变性和传统试错测试高成本的挑战。 该模型并非旨在*取代*标准的混凝土测试,而是推荐有希望的配比进行验证,从而可能减少材料浪费和成本。讨论强调了混凝土生产的复杂性——受当地材料质量、区域差异以及众多超出配比比例的因素影响。 评论员强调了严格测试的重要性,并告诫不要仅仅依赖AI预测来保障安全关键基础设施。虽然有些人表示怀疑,但另一些人则看到了在强度、速度和可持续性方面优化混凝土的潜力,特别是考虑到Meta的数据中心对混凝土的大量需求。该项目旨在利用AI提高现有施工实践的效率,而不是绕过它们。

## Zerobox:轻量级、安全的代码沙箱 Zerobox是一个跨平台工具(macOS, Linux,计划支持Windows),用于安全地运行不受信任的代码,由OpenAI Codex的沙箱运行时提供支持。它采用“默认拒绝”原则,除非明确允许,否则会阻止文件访问、网络请求和环境变量继承。 主要特性包括:通过`--secret`和`--secret-host`进行**凭证注入**(传递API密钥,而无需将其暴露给进程),使用`--allow-read`和`--allow-write`进行**文件访问控制**,以及使用`--allow-net`和`--deny-net`进行**网络过滤**。Zerobox提供灵活的环境控制,允许继承所有、特定或不继承父环境变量。 它旨在安全地执行AI生成的代码、运行构建和进行测试,开销最小(~10毫秒,~7MB)。提供了一个TypeScript SDK用于程序化控制。安装通过shell脚本简单,使用通过命令行标志或SDK直接。Zerobox优先考虑安全性,防止在运行潜在有害代码时发生数据泄露和文件损坏。

## Zerobox:轻量级命令沙箱 Zerobox 是一款新的、跨平台的 CLI 工具,使用 Rust 编写,允许用户对命令进行沙箱化,并对文件、网络和凭据访问进行细粒度控制。它利用现有的操作系统级别的沙箱机制(如 Linux 上的 BubbleWrap),并基于 OpenAI Codex 的沙箱化 crates 构建,增加了密钥注入等功能。 该工具采用默认拒绝原则,除非明确允许,否则会阻止写入和网络 I/O。其关键特性是能够在不向沙箱化进程暴露密钥的情况下注入密钥,在网络调用期间使用占位符/替换技术。 Zerobox 并非 Docker 等完整虚拟化的替代品,但它提供了一种轻量级的替代方案,具有最小的开销(约 10 毫秒)以及保护本地 AI 代理执行和其他敏感操作的强大潜力。开发者正在积极寻求反馈,特别是来自使用 AI 代理的人员,并计划根据社区的意见改进文档和测试。 提出的问题包括需要强大的测试来建立可信度,以及有关网络控制的潜在平台限制。

对不起。

阿耳忒弥斯2号是美国宇航局“阿耳忒弥斯”计划下的首次载人任务,将从佛罗里达州的肯尼迪航天中心发射。它将搭载美国宇航员里德·维斯曼、维克多·格洛弗、克里斯蒂娜·科赫和加拿大航天局宇航员杰里米·汉森,进行为期约10天的月球绕行之旅。任务目标包括首次测试“猎户座”飞船的生命支持系统,并为未来的载人“阿耳忒弥斯”任务奠定基础。

更多

联系我们 contact @ memedata.com