每日HackerNews RSS

## Heretic:语言模型的自动化去审查 Heretic 是一种新工具,旨在移除基于 Transformer 的语言模型的审查(“安全对齐”),*无需* 昂贵的重新训练。它利用一个名为“abliteration”(定向消融)的自动化过程,由智能参数优化器(Optuna/TPE)引导。 Heretic 通过微妙地修改模型的内部参数来抑制被标记为“有害”的回复,同时保留其核心智能。重要的是,它不需要对 Transformer 架构的专业知识;用户只需从命令行运行它。 该工具实现了与手动创建的去审查模型相当的结果,但对原始模型能力造成的损害更小,如 KL 散度所示。它支持许多稠密和多模态模型,但目前不支持 SSM 或具有复杂架构的模型。 安装很简单,使用 `pip install heretic-llm`,去审查过程完全自动,通常在 RTX 3090 上对一个 8B 参数模型进行处理需要大约 45 分钟。使用 Heretic 创建的去审查模型可在 Hugging Face 上找到。

## Windows GDI 漏洞通过模糊测试发现 Check Point Research (CPR) 在2025年1月发现Windows图形设备接口 (GDI) 新的基于Rust的内核组件中存在安全漏洞。通过针对GDI的增强型图元文件 (EMF/EMF+) 模糊测试活动,CPR 触发了内核级崩溃——蓝屏死机 (BSOD),原因是Rust代码中边界检查失败。 该漏洞位于 `region_from_path_mut()` 函数中,是由一个特制的EMF+文件中的错误路径几何体触发的。虽然微软将此问题归类为中等程度的拒绝服务,但CPR认为用户可控的崩溃是一个安全问题。修复程序已在OS Build 26100.4202 (KB5058499,发布于2025年5月28日) 中实施,它引入了一个边界加固的边缘处理例程,并由一个功能标志进行控制。 这一发现强调了,虽然Rust增强了内存安全性,但强大的测试和设计仍然至关重要。失败的安全检查不应导致系统故障。CPR的研究证明了主动模糊测试和彻底分析的重要性,即使在利用内存安全语言的代码库中也是如此,并且代表了第一个公开披露的基于Rust的Windows内核组件中的安全问题。

最近微软团队的一项成就,在Hacker News上有所详细介绍,强调了通过Rust技术在Windows内核安全方面取得的进展。一个使用WinAFL模糊测试器(用C/C++编写)检测到新基于Rust的内核组件中的一个错误,导致了受控崩溃(蓝屏),原因是内存访问越界。 起初这似乎有些讽刺——Rust的错误是由C/C++工具发现的——但评论员澄清这并非典型的安全漏洞。Rust的安全特性*有意*在发生错误时触发panic(崩溃),从而防止潜在的利用。这种“拒绝模糊测试”——将潜在的漏洞转化为可管理的崩溃——是一项重要的改进。 该事件展示了Rust能够通过堆栈跟踪提供清晰的调试信息,从而促进快速修复。一些人认为,像WUFFS这样的工具更适合于关键的低级解析,即使是受控的panic也是不可接受的,强调了对不受信任的文件格式进行严格验证的重要性。

## 复古大型语言模型:摘要 本次演讲探讨了“复古”大型语言模型(LLM)的概念——那些训练数据限定于过去特定时间点,例如1900年甚至公元200年的模型。这些模型不仅仅是历史上的好奇之物,它们为科学和人文研究提供了独特的机会。 **动机**包括测试人工智能的预测能力(预测如2020年疫情等事件,*而不知道*它已经发生),通过“重新发明”早期时代的现代思想来探索科学发明,以及实现交互式的“时间旅行”对话。 **挑战**集中在数据稀缺、确保数据不被“污染”于未来知识以及高昂的训练成本。 提出的解决方案包括利用其他LLM生成的合成数据,并采用“分叉的按时间顺序训练”来降低计算成本。 进一步的概念包括允许复古LLM将任务“外包”给更强大的现代LLM(小心避免信息泄露),以及创建了解文档日期的分层LLM,以便提供特定于上下文的响应。最终,复古LLM有望为理解知识演变和拓展人工智能能力提供一种新颖的方法。

## 经典LLM与历史洞察 - Hacker News 摘要 Hacker News上的一场讨论围绕着利用较旧的“经典”大型语言模型(LLM)进行独特的研究和信息收集。核心概念,在链接文章 ([https://owainevans.github.io](https://owainevans.github.io)) 中有探讨,是利用在特定事件*之前*训练的LLM,以获得更少偏见的角度——尤其是在分析当前冲突或容易发生“信息战”的话题时。 用户建议的应用包括通过测试较旧的LLM是否能独立“发现”知识,来验证新兴模型的能力,以及研究语言中随时间推移嵌入的历史偏见。有人提出了对历史数据集中的数据选择偏见以及“黑天鹅”事件对模型准确性的影响的担忧。 对话还涉及了阻碍LLM训练获取原始数据来源的版权问题,以及保存较旧模型作为知识和社会观点的历史快照的价值。 许多评论者对分析历史法庭记录或使用经典LLM研究不断变化的偏见等项目表示热情。

## 增量解析与垃圾回收的见解 作者在使用Ohm(一种增量解析器)和ProseMirror构建双向文本编辑器时遇到了性能问题。目标是在底层文本更改时,利用Ohm的增量解析能力来高效地更新ProseMirror文档。 最初的解决方案是“追踪”所有节点,以识别编辑期间被删除的节点——本质上是一种垃圾回收方法。然而,这违背了增量性的目的,即使对于小的更改也需要对整个文档进行扫描。 回忆起论文“垃圾回收的统一理论”中的一个关键见解,作者切换到“引用计数”方法。他们不再追踪*存活*节点,而是通过在文档更新时递减引用计数来追踪*死亡*节点。这使得他们能够快速识别被删除的节点,而无需遍历整个文档,从而显著提高了增量更新的性能。核心思想是关注识别哪些内容被*删除*,而不是哪些内容*保留*,这反映了垃圾回收中追踪和引用计数之间的对偶性。

## Hacker News 讨论总结:垃圾回收与引用计数 一个 Hacker News 帖子引发了关于垃圾回收(GC)与引用计数的讨论。核心争论在于引用计数是否是“较差”形式的 GC。引用计数通过在引用消失时递减计数来有效地管理对象生命周期,但它难以处理循环——对象相互引用,导致单个计数无法达到零的情况。 参与者强调了权衡:引用计数提供确定性性能,并且可以作为 C++ 和 Rust 等语言的库实现,提供受控的清理。GC 虽然通常更优越,但可能会引入暂停和复杂性。 对话还涉及软件设计中对称性的重要性以及抽象如何“泄露”底层复杂性,从而影响性能。一些评论者分享了构建自定义 GC 系统的经验,并指出管理内存效率的挑战,尤其是在使用持久化存储时。最终,最佳方法取决于特定应用程序及其性能要求,GC 对于并发数据结构等复杂场景至关重要。

超过150名巴勒斯坦人乘坐从加沙出发的航班意外抵达南非,引发了拉马福萨总统对他们旅行情况的担忧。以色列当局证实,这些巴勒斯坦人仅在获得一个未具名的第三国入境批准后才被允许离开加沙。 该群体最初因缺少以色列出境章而在约翰内斯堡机场被滞留,最终在非政府组织“赠予者”的帮助下获准下机。其中130人留在南非,23人前往其他目的地。 以色列官员表示,他们根据外国的要求,基于医疗需求、公民身份或现有签证,协助加沙居民离境。自10月7日以来,已有超过4万名加沙居民获准离境。“赠予者”表示他们不清楚是谁包租了这些航班。此事发生在南非强烈支持巴勒斯坦事业以及在国际法院对以色列提出种族灭绝指控的背景下。

Bluesky的“Atmosphere”允许两种发布方式:客户端可以直接写入用户的个人数据存储(PDS – 选项1),或者应用程序可以代表客户端与PDS通信(选项2)。 选项1赋予“纯客户端”权力,并允许PDS提供商控制用户体验,但会导致确认发布延迟(客户端在发布完全索引之前收到“成功”消息),并且需要PDS特定的逻辑。 选项2提供更流畅的用户体验和更好的性能,但会降低PDS的控制权和政治影响力。目前,Bluesky的官方应用程序使用选项1,但新的开发方向倾向于选项2。 争论的中心在于平衡用户体验、开发者自由和PDS作为潜在制约应用程序力量的作用。作者倾向于选项2,因为它清晰且性能更好,但他们也承认PDS控制的价值。一种潜在的解决方案是Bluesky提供服务器资源作为服务,将一些控制权*转移到*应用程序,并降低开发成本。最终,Atmosphere社区需要决定哪种方法最符合其目标。

短暂的圣诞节回家后,马里奥娜在一次失败的逃跑尝试后被强行送回马德里修道院。她被隔离并被贴上叛逆者的标签,内心深感孤独,开始拒绝进食,最终被送入精神病院。在那里,她遭受了残酷的治疗,包括电击疗法,更令人担忧的是,胰岛素昏迷疗法——一种通过高剂量胰岛素诱导医疗昏迷的危险做法。 马里奥娜认为这种“疗法”严重损害了她的记忆,促使她开始写日记。精神病院强迫她进食的尝试升级到身体上将她束缚在床上。绝望至极,并曾考虑自杀,她被告知达到40公斤的体重才能获释。这段经历导致她产生深刻的顺从和接受感,不可逆转地改变了她的精神状态,并在她后来的日记中留下了持久的影响,这些日记成为了关于她遭遇的纪录片的基础。

炼金术 Alchemy 10 天前

## 人工炼金术的徒劳 历史上,炼金术士试图将贱金属转化为黄金,相信富足会带来财富。但作者指出这种逻辑上的经济缺陷——如果市场充斥着黄金,黄金的价值就会贬值,就像盐变得普遍且失去价值一样,随着生产技术的进步。 这与目前通过人工智能生成艺术进行的“炼金术”追求相呼应。虽然最初备受期待,但人工智能内容的快速传播已经降低了它的价值。人们越来越能够识别并主动*贬低*人工智能创作的作品,认为它们缺乏灵魂,并且缺乏艺术中固有的情感联系。 作者认为,艺术的价值不仅在于最终产品,还在于创作背后的挣扎、故事和意图。人工智能绕过了这个关键要素,产生了技术上新颖但最终毫无意义的内容。就像无限的黄金不会创造财富一样,无限的人工智能艺术也不会创造价值;相反,它使创作本身变得毫无价值。尽管可能导致工作岗位流失,但真正的创造力——以及它所体现的人性——将继续存在,因为正是人类表达的*稀缺性*赋予了艺术价值。

## 炼金术、人工智能与创造的价值:黑客新闻讨论总结 黑客新闻上的一场讨论围绕着这样一个想法:轻易创造出以前稀缺的东西——比如通过炼金术制造黄金,或者通过人工智能创作艺术——不一定否定价值,而是改变了价值的实现方式。最初的观点认为,第一个“解决”炼金术问题(或大规模创作人工智能艺术)的人将获得巨额利润,即使他们知道大规模生产最终会降低产品价值。 评论者对此进行了辩论,并将其与历史上的例子进行类比,例如西班牙殖民主义(用新大陆的黄金膨胀经济)以及数字音乐制作的影响。一些人认为,增加可访问性并不会破坏价值,而是改变它——就像iPhone普及摄影一样。另一些人指出,价值不仅仅是经济上的;艺术的价值并不完全取决于生产难度。 一个关键点是,人工智能生成的内容最终是服务于人类需求,还是优先为少数人谋利,从而可能贬低人类的创造力。最终,这场讨论突出了稀缺性、可访问性和创造性领域感知价值之间复杂的关系,并质疑核心问题是精英主义还是真正的艺术价值。

2025年10月底,该网站遭到爬虫程序的攻击,导致服务器压力增大,并促使考虑更强大的防御措施,例如“Anubis”。作者对这一反复出现的问题感到遗憾,认为这又是人工智能爬取降低软件业余爱好乐趣的一种方式,同时还存在环境影响和批判性思维方面的问题。 攻击使服务器不堪重负,接收到大量Git提交日志请求,触发了Fail2ban并使CPU使用率达到峰值。虽然现有的安全措施不足以立即阻止这些狡猾地伪装浏览器身份信息的爬虫程序,但作者暂时阻止了来自新加坡阿里巴巴托管的攻击IP范围(47.79.0.0/16)。 这一事件凸显了自托管的挑战以及业余爱好者维护独立在线空间日益增加的难度。作者由于隐私问题抵制像Cloudflare这样的集中式解决方案,但承认需要更强大的防御,可能会将Gitea实例迁移到其他地方。尽管感到沮丧,他们仍然致力于维护该网站。

## 供应链安全:一个与计算历史同样古老的问题 Ken Thompson 在 1983 年的图灵奖演讲“对信任的思考”中,强调了一个关键且持续存在的问题:供应链安全。他展示了如何巧妙地修改 C 编译器,在不改变源代码的情况下,向“login”等程序中插入后门——这一壮举可以通过利用编译器在自我编译过程中“学习”值的方式来实现。 演讲详细描述了一个三步过程:创建自我复制程序(“quine”),利用编译器行为嵌入源代码中不存在的值,并利用这些值引入恶意代码。最近,Thompson 的原始代码被重新发现并成功运行,证明了这种漏洞依然存在。 虽然该后门并未广泛部署(据报道已被 PWB 发现并控制),但其原理仍然具有现实意义。现代系统面临类似的风险,复杂的软件依赖关系为攻击者创造了许多潜在的入口点。 当前的防御措施包括多样化的双重编译——通过使用多个独立的编译器构建代码来验证代码,以及关注可重现构建,确保从相同的输入获得一致的输出。尽管取得了进步,但核心问题仍然存在:我们越来越依赖来自不可信来源的二进制文件,因此保持警惕和健全的验证流程对于维护系统安全至关重要。Thompson 的工作提醒我们,信任必须通过努力获得,而不能想当然,尤其是在软件供应链中。

一场 Hacker News 的讨论围绕着对 Ken Thompson 的《关于信任的思考》论文的 2023 年重新审视,该论文探讨了恶意代码嵌入到编译器工具链中的可能性。一个关键点是,即使对于像 Linux 这样的开源软件,也很少有人会验证分发二进制文件与源代码的完整性——尽管 Arch Linux 和 Debian 正在朝着“可重现构建”的方向努力。 几位评论员强调了旨在解决这一供应链安全风险的项目。Stagex 被介绍为一种构建工具链,强制实现 100% 的确定性和完全的源代码引导,旨在消除对个人贡献者或系统的信任。其他相关举措包括 Bootstrappable Builds、reproducible-builds.org,以及 Nix/Guix 等项目。 虽然所描述的攻击的具体例子很少(链接了一个潜在案例),但讨论强调了检测的难度以及可验证、可引导的工具链对于确保软件可信度的重要性。

更多

联系我们 contact @ memedata.com