MemeData

不小心用Claude Code制造了我的第一个fork炸弹。 Accidentally created my first fork bomb with Claude Code 17 小时前

## 克劳德代码分叉炸弹及 600 美元教训这讲述了一位开发者二月份使用克劳德代码（CC）——一种新的 AI 编程工具——的混乱经历。起初犹豫不决，他深入研究，构建了自定义“技能”——用于任务管理（/adhd）、上下文窗口优化（/yablind）、日志记录（/memento）和调试（/yadumb）的工具——这得益于注意力缺陷多动症驱动的过度专注。然而，一个新创建的“SessionStart”钩子无意中生成了指数级的 CC 实例（分叉炸弹）。开发者在不知情的情况下在夜间释放了它，第二天早上发现电脑完全无响应且过热。绝望地尝试杀死这些进程失败了，迫使他进行了硬重启。更糟糕的是，失控的 CC 实例产生了 600 美元的 API 费用。幸运的是，CC 本身固有的低效——巨大的内存消耗——在费用变得无法控制*之前*触发了系统锁定。这次经历是一次代价高昂但宝贵的教训，关于代理工作流程、仔细实现钩子的重要性，以及勉强接受“糟糕代码”拯救这一天的现实。该开发者现在计划进一步开发，并暗示对感兴趣的人们会有更多“疯狂的抱怨”。

一位 Hacker News 用户在使用 Claude Code 实验时意外创建了一个炸弹分叉程序，引发了关于类似经历的讨论。许多评论者分享了他们自己“第一次”炸弹分叉程序的故事，通常源于大学实验——甚至有人试图使用 pthreads 炸弹来绕过分叉保护！最初的事件涉及 Claude Code 递归地生成自身实例，目的是确保即使会话结束钩子失败也能捕获对话摘要。其他人也注意到类似的策略，包括最近的一篇文章详细介绍了 Claude 代码作者使用多个实例（可能用于 token 使用）。对话还涉及人工智能驱动的生产力带来的更广泛的影响，以及即使是有缺陷的人工智能代码也能胜过人类的认识。建议了管理多个 AI 会话的解决方案，例如使用 Git 工作树和轻量级虚拟机。一条怀旧评论回忆起更简单的时代，当时“炸弹分叉程序”表现为 autoexec.bat 文件中的无限循环。

从300KB到69KB每个Token：LLM架构如何解决KV缓存问题 From 300KB to 69KB per Token: How LLM Architectures Solve the KV Cache Problem 17 小时前

## AI 记忆的物理性：摘要大型语言模型（LLM），如 ChatGPT，并非通过隐喻的方式“记住”对话，而是通过“键-值”（KV）缓存——实际存储在 GPU 内存中的字节数据。该缓存存储从对话中的每个 token 派生的键值对，使模型能够快速响应，而无需重新处理整个历史记录。然而，这种记忆在 GPU 资源方面代价高昂，并且是临时的，会话结束后消失。过去六年，LLM 架构不断发展，以更有效地管理这种记忆。早期模型（GPT-2）使用完全记忆，独立存储所有内容。较新的模型（Llama 3、DeepSeek V3、Gemma 3）采用共享表示、压缩和选择性注意力等技术来减小缓存的大小，在内存使用和性能之间取得平衡。一些模型（Mamba）甚至完全放弃了 KV 缓存，而选择过滤。这种演变凸显了一个根本的权衡：完全记忆与高效处理。当前聊天机器人中的“记忆”功能是独立的系统，长时间对话会因信息退化而导致“上下文腐烂”。最终，KV 缓存代表了 AI 短期记忆的物理限制，促使人们探索外部存储，并可能探索能够管理自身记忆的 AI 系统——这是迈向真正适应性数字思维的关键一步。

## LLM KV 缓存解决方案 - Hacker News 摘要一篇 recent future-shock.ai 上的文章详细介绍了大型语言模型 (LLM) 架构如何解决不断增长的 KV 缓存大小问题——将其从每个 token 的 300KB 减少到 69KB。这对于更长的上下文窗口和降低成本至关重要。讨论强调了几种方法：例如分组查询注意力 (GQA) 和多层注意力 (MLA) 等架构创新，以及 KV 缓存本身的量化（使用 llama.cpp 中的 q8/q4 等方法），可以使内存使用量减半。新兴技术，如 TurboQuant，利用极坐标，有望实现更大的（5 倍）内存减少，且质量损失最小。评论员还指出 OpenAI 对缓存命中收取 90% 的费用，而不是最初声明的 50%。一个批判性的观点指出，这篇文章过于简化了“内存”格局，模糊了不同缓存层和机制之间的区别。虽然引人入胜，但这可能会掩盖具体的 technical challenges 和解决方案。

斯科蒂：一个漂亮的 SSH 任务运行器 Scotty: A beautiful SSH task runner 17 小时前

## Scotty：现代 SSH 任务运行器 Spatie 发布了 Scotty，一个用于直接从终端运行 SSH 任务和部署脚本的新工具。Scotty 作为 Laravel Envoy 的精神续作，提供了更精简的体验，具有实时、详细的输出以及在部署过程中暂停执行的能力。 Scotty 同时支持 Laravel Envoy 的 Blade 格式*和*一种新的、更简单的纯 Bash 格式——为所有偏好的用户提供灵活性。任务在 `.sh` 文件中使用带有 `# @task` 注释的 Bash 函数定义，使其易于阅读和编辑，并具有完整的 Shell 支持。主要功能包括：用于设置验证的 `doctor` 命令，用于模拟运行的 `pretend` 模式，以及通过命令行传递变量的能力。Scotty 还会在完成时提供任务计时摘要，并允许暂停进行部署中检查。现有的 Laravel Envoy 用户可以无缝使用他们的 `.blade.php` 文件，并按照自己的节奏迁移到 `.sh` 格式。Scotty 现已在 GitHub 上发布，并提供完整文档。

对不起。

好的代码终将胜出。 Slop is not necessarily the future 17 小时前

人工智能生成代码的激增引发了人们对大量低质量“垃圾代码”入侵软件开发的担忧。虽然有人预测人类编码的终结，并且数据显示代码复杂度及故障率都在上升，但Greptile认为经济激励最终会促使人工智能生成*高质量*代码。目前，“蛮力”方法——快速生成和迭代——占据主导地位，导致代码库更大、更密集。然而，好的代码以简洁和清晰的设计为特征（如John Ousterhout所概述），从长远来看，维护和扩展成本更低。它需要的上下文更少，修改次数更少，最终，需要的计算资源也更少。人工智能模型之间的竞争将有利于那些能够帮助开发者*最快*交付可靠功能的模型，这需要干净、易于维护的代码。虽然最初的重点是让人工智能代码*能够运行*，但市场最终会优先考虑效率和成本效益，迫使人工智能将质量置于数量之上。这种转变至关重要，因为软件复杂度持续上升，更简单的代码将是可持续发展的必要条件。

## 黑客新闻讨论：好的代码还会胜出吗？一篇黑客新闻讨论，源于一个链接 (greptile.com)，围绕着写得好的代码最终是否会胜出的问题展开。最初的帖子认为会，但评论者很快争论了“好”的定义——它是健壮的，还是仅仅*有用*且具有成本效益？许多人认为，工程学通常优先考虑功能和可负担性，而不是寿命，并举例说明桥梁被建造得“勉强”能承受压力。还有人指出罗马混凝土的历史例子，证明建造耐久品*是*可能的，但可能会以牺牲分配给其他需求的资源为代价。对话还涉及了人工智能的影响。一些人认为人工智能将使小型参与者能够竞争，而另一些人则认为它不会改变现有模式，即优先考虑上市速度而不是代码质量。几位评论员挑战了先发优势总是获胜的观点，并举例说明谷歌超越了雅虎。最后，关于随着越来越强大的人工智能模型，软件开发的未来出现了一场辩论。

保护椭圆曲线加密货币免受量子漏洞影响 [pdf] Securing Elliptic Curve Cryptocurrencies Against Quantum Vulnerabilities [pdf] 17 小时前

这似乎不是可以翻译的文本。它看起来像一个PDF文件的内部数据流，包含二进制代码和乱码，而不是人类可读的语言。

## 量子威胁对加密货币：黑客新闻摘要最近的黑客新闻讨论集中在谷歌的一篇论文上，探讨了如何保护椭圆曲线加密货币免受量子计算漏洞的影响。虽然量子计算（QC）的理论进展迅速——量子比特数量呈指数增长，错误率降低——但理论与实际应用之间仍然存在显著差距。尽管已经分解了大于21的数字，但对比特币安全性的实际威胁仍然需要数年时间。对话强调了为潜在的量子威胁做好准备的紧迫性，特别是对于使用易受攻击地址类型的旧比特币钱包。不采取行动的后果是巨大的，可能允许国家夺取大量的加密货币持有量。尽管签名尺寸和CPU使用量增加，但转向后量子密码学（PQC）的成本相对较低。然而，一些人认为，在ECC出现可证明的突破之前，关注量子抗性还为时过早。另一些人将其与过去的科技焦虑（如Y2K）相提并论，认为即使时间表不确定，积极的准备也是至关重要的。以太坊正在积极研究PQC解决方案，预计未来将进行大规模账户迁移。

Lime（自行车）是一家数据公司。 Lime (bikes) is a data company 17 小时前

## 我三年Lime单车数据：使用Claude的深度分析三年间，Lime单车一直是我在伦敦的主要交通工具，累计骑行超过6000公里。出于好奇，想确认自己是否是“重度用户”，我利用GDPR要求Lime提供我的完整数据集，并使用Claude进行了分析。分析结果显示我属于“钻石”级别，排在前1%的用户——“超翡翠”通勤者！除了确认我的使用情况，Claude还揭示了有趣的信息。它准确地 pinpoint 了我过去和现在的家庭和工作地点，甚至仅根据骑行数据就识别出我搬家和换工作的时间。此外，Claude 推断出了我常去的地点：健身房、最喜欢的早午餐店、牙医诊所和莎莎舞班——所有这些都没有任何额外信息。我甚至可视化了一张“第三空间”地图，展示了我经常的路线和感兴趣的点。这个实验展示了将数据隐私权与人工智能相结合的力量。欧盟/英国的任何人都可以从Uber、Revolut甚至约会应用程序等应用程序请求数据，并使用Claude等工具来发现隐藏的模式并获得令人惊讶的自我认知。个人发现的潜力是巨大的。

一场 Hacker News 的讨论围绕着在伦敦使用 Lime（自行车/滑板车租赁）的成本。一位用户对三年花费 3000 英镑感到震惊，认为购买多辆自行车会更便宜。然而，其他人反驳说，这笔费用与伦敦公共交通的年费相当（旅行卡约为 2800 英镑），并且提供了极大的便利性。其价值在于访问一个维护良好、随时可用的电动自行车/滑板车网络，*无需*承担被盗、维护或存储的风险——这些成本会随着自行车拥有权的增加而迅速累积，尤其是在像伦敦这样的城市。这场讨论强调，虽然拥有自行车*可能*更便宜，但 Lime 提供了一种服务——便捷、可靠的交通——许多人认为这值得花费，将其视为一种公共交通形式。一位评论员还指出，许多公司本质上是“数据公司”。

展示 HN：Forkrun – 了解 NUMA 的 shell 并行化工具（比 parallel 快 50 倍–400 倍） Show HN: Forkrun – NUMA-aware shell parallelizer (50×–400× faster than parallel) 17 小时前

## forkrun：高性能并行器 forkrun 是 GNU Parallel 和 xargs -P 的即插替代品，旨在大幅加速基于 shell 的数据准备，在现代 CPU 上实现 **50 倍至 400 倍** 的加速，尤其是在 NUMA 架构上。它拥有 **20 万次/秒以上的批处理分发** 和 **95-99% 的 CPU 利用率**，远高于 GNU Parallel 的约 6% 利用率。 forkrun 性能的关键在于其“原生本地”设计，最大限度地减少跨 socket 的内存流量并利用 NUMA 感知。它采用了一种新颖的管道，包含数据摄取、索引、声明和回收工作四个阶段，所有阶段都针对物理局部性进行了优化，并采用诸如 `splice()` 和无锁环形缓冲区等技术。安装很简单：下载并 source 一个包含嵌入式自解压 C 扩展的 bash 脚本（无外部依赖）。使用方法与 GNU Parallel 相同 – 简单地将 `parallel` 替换为 `frun`。 forkrun 具有 **自适应调优** 功能，无需用户配置即可自动优化批处理大小。它需要 Bash 4.0+ 和 Linux Kernel 3.17+，并优先进行故障隔离和集群集成方面的持续开发。

## Forkrun：更快的 Shell 并行器 jkool702 发布了 **forkrun**，这是一款新的基于 shell 的并行化引擎，旨在显著优于 GNU Parallel 等工具，尤其是在现代多核 NUMA 硬件上。经过 10 年开发，forkrun 通过采用 NUMA 感知内存放置、SIMD 扫描和无锁批处理声明等先进技术，在典型工作负载上实现了 **50 倍至 400 倍** 的速度提升。在 i9-7940x 上的基准测试显示，forkrun 分发 **200,000+ 批/秒**，所有核心的 CPU 利用率达到 **95-99%**，而 GNU Parallel 约为 ~500 批/秒，利用率约为 ~6%。 Forkrun 被设计为 `xargs -P` 和 GNU Parallel 的直接替代品，无需安装 – 它以单个 bash 文件形式提供，并嵌入了 C 扩展。它非常适合高频率、低延迟的任务，例如日志处理和数据准备。您可以在 [GitHub](https://github.com/jkool702/forkrun) 上找到更多信息、基准测试和源代码。安装只需 source bash 文件即可：`. frun.bash`。

项目马里奥：DeepMind的内幕故事 Project Mario: the inside story of DeepMind 18 小时前

启用 JavaScript 和 Cookie 以继续。

黑客新闻新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 Project Mario：DeepMind 的内幕故事 (colossus.com) 13 分，来自 highfrequency 12 小时前 | 隐藏 | 过去 | 收藏 | 讨论帮助指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系搜索：

点 – 一款 Siri 替代品，通过 Apple Shortcuts 学习技能。 Dot – A Siri Replacement learns skills through Apple Shortcuts 18 小时前

Dot 是一款注重隐私的个人 AI 助手，适用于 iPhone，直接在您的设备上运行，无需云服务或帐户。它通过学习您的使用习惯，利用 Apple Shortcuts 在您现有的应用程序中自动化任务——甚至可以根据需求创建新的快捷指令。 Dot 可以管理智能家居设备、处理提醒和日历、发送消息/电子邮件、播放音乐和创建笔记，所有操作均可免提进行。其关键特性是适应性；只需*询问* Dot 执行新的操作，它就会尝试为您构建自定义技能。 Dot 优先考虑用户控制，提供 AI 提供商的选择（Claude、Kimi 或 Apple 的设备端模型，包括离线选项）和完全透明度。它通过包含标准自动续订条款的付费订阅提供。您的数据始终安全且私密，仅存储在您的 iPhone 上。

对不起。

展示 HN：Hyprmoncfg – Hyprland 的基于终端的显示器配置管理器 Show HN: Hyprmoncfg – Terminal-based monitor config manager for Hyprland 18 小时前

## hyprmoncfg：Hyprland 的基于终端的监视器配置工具在 Hyprland 中配置多监视器设置，传统上是一个令人沮丧且迭代的过程，需要编辑配置文件而没有即时视觉反馈。现有的工具提供部分解决方案——没有守护进程的空间编辑器，或具有有限布局控制的守护进程——通常带有大量的依赖项。**hyprmoncfg** 旨在通过轻量级、强大且可靠的解决方案来解决这个问题。该工具提供了一个**基于终端的 (TUI) 空间编辑器**，允许用户将监视器以矩形的形式可视化排列，并通过键盘快捷键进行对齐和精确控制。它包括一个监视器检查器，用于调整分辨率、缩放和刷新率，以及一个工作区规划器，具有顺序、交错和手动分配策略。至关重要的是，**hyprmoncfg** 具有**安全的应用系统**和自动回滚功能，可防止配置损坏。它还会**验证 Hyprland 的配置加载**，以避免静默失败。配置文件存储为 JSON 格式，可以与 chezmoi 等点文件管理器无缝集成，从而实现跨机器的可移植性。 **hyprmoncfg** 仅包含两个 Go 二进制文件和一个 Hyprland 依赖项，避免了 Python、GTK 和 D-Bus 的臃肿，甚至可以通过 SSH 进行远程故障排除。它旨在提供可靠性和便利性，提供 Monique 的功能集，而无需依赖项开销。

对不起。

每日HackerNews RSS