MemeData

HipKittens: 快速且强大的AMD内核 HipKittens: Fast and furious AMD kernels 12 天前

## HipKittens：弥合AMD AI软件差距目前，AI开发受到硬件限制，扩大计算格局至关重要。虽然AMD GPU提供具有竞争力的性能，但其软件生态系统落后于NVIDIA，阻碍了其能力的充分利用。本文介绍**HipKittens**，这是一系列优化的AMD内核和编程原语，旨在简化和加速AMD GPU开发。研究表明，现有的AMD软件（AITER、PyTorch、Triton、Mojo和TileLang等编译器）通常无法达到峰值性能，需要对低级汇编进行大量的手动优化——这是可扩展性的重大障碍。HipKittens通过利用NVIDIA开发中成功使用的**基于切片的抽象**（ThunderKittens），并将其适应于AMD独特的架构来解决这个问题。主要发现表明，这些基于切片的原语在不同架构上具有良好的泛化性，能够实现可读、易于维护的代码，在注意力机制和GEMM操作中**优于AMD现有的基线**——包括手动优化的汇编内核。HipKittens旨在普及AMD GPU在AI中的使用，摆脱繁琐的汇编编程，为更加多样和开放的AI硬件生态系统铺平道路。代码和研究已公开发布。

## AMD 与 AI 进展：摘要最近 Hacker News 上的讨论强调了 AMD 在 AI 能力方面取得的显著进展，摆脱了过去软件方面一直存在的挑战。George Hotz (georgehotz) 透露与 AMD 签订了在 MI350X 硬件上训练 Llama 的合同，并指出 PyTorch/ROCm 支持有了实质性改进——曾经几乎无法使用，现在可以用于运行 nanochat 等任务。虽然仍落后于 NVIDIA，但 AMD 已经不再被认为毫无希望，软件投入是关键。对话的中心是优化 AMD GPU 以用于 LLM，HipKittens 等项目提供了关于需要改进领域的宝贵见解。Tinygrad 正在积极实施这些优化。用户报告在 AMD 硬件（甚至消费级硬件）上本地运行 LLM 的积极体验，尽管专用 GPU 仍然更快。一个关键的收获是 AMD 竞争力的日益增强，这得益于硬件改进和对软件的重新关注。虽然 NVIDIA 仍然保持着强大的地位，尤其是在数据中心，但 AMD（以及其他公司）迎头赶上的潜力正在增加，特别是随着 AI 领域的扩展，不再受 NVIDIA 当前主导地位的限制。人们仍然担心 AMD 的内部开发实践以及真正竞争所需的增加投资。

谷歌是否解决了人工智能两个最古老的问题？ A new Google model is nearly perfect on automated handwriting recognition 12 天前

## Gemini AI 能力的潜在飞跃近期，用户在谷歌的 AI Studio 中发现，他们的 Gemini 模型，可能为 Gemini-3，正在进行 A/B 测试，并展现出显著的进步。用户报告称，该模型能够仅通过单个提示生成操作系统、3D 软件和模拟器的可用代码，能力出乎意料地强大。值得注意的是，该模型在转录历史手稿方面表现出色，准确率接近专家水平——超越了之前的版本和专业软件。然而，最引人注目的发现是它*无需提示*即可执行复杂的推理。例如，在转录 18 世纪商人的账簿时，该模型正确推断出缺失的计量单位，并使用历史货币系统进行计算，展现了以往大型语言模型中从未见过的上下文理解能力。这表明可能从模式识别转向真正的理解，暗示着随着规模和复杂性的增加，涌现出推理能力。虽然确切的机制尚不清楚，但这一飞跃可能会彻底改变需要视觉精度和推理的领域，例如历史研究，并可能预示着人工智能在从预测向真正理解方面取得更广泛的突破。其影响既令人兴奋，又可能具有颠覆性，表明人工智能可能比以前预期的更接近专家级别的推理能力。

第一个微处理器 – 50周年 (2020) First Microprocessor – 50th Anniversary 2020 12 天前

20世纪70年代初，艾瑞搜索公司和美国微系统公司合作，为F-14A战斗机创造了第一个完全集成的数字空速计算机（CADC），这是对先前机械系统的重大飞跃。这项突破性成就历时两年，由一个25人以上的团队完成，采用了最先进的组件，包括石英传感器和雷·霍尔特设计的定制MOS-LSI芯片组。尽管如此，该芯片组的架构细节在数十年内仍被保密。霍尔特1971年的设计论文《微处理器的架构》直到1998年才被解密发表，随后在《华尔街日报》和复古计算机节上公开宣布。 F14A的MP944微处理器被声称为许多领域的*第一*：微处理器芯片组、航空航天微处理器、电传飞行计算机、军用微处理器和量产微处理器，并具有20位架构、内置自检和并行处理等功能。

黑客新闻上围绕第一个微处理器的50周年展开讨论，引发了关于什么*真正*算得上“第一个”的争论。在庆祝这一里程碑（firstmicroprocessor.com）的同时，评论员们指出Ken Shirriff的IEEE文章详细说明了确定这一称号的复杂性。核心争论在于，仅仅将现有设计（由独立元件构成）缩小到单个芯片上，是否能构成真正的微处理器。一位评论员认为，微处理器需要一个完整的、可编程的CPU——算术逻辑单元、控制功能和寄存器——集成在单个芯片上。另一位评论员指出，这些早期的芯片并非*本质上*是发明，而是对现有设计的实现。他们认为，真正的创新是将CPU作为独立组件出售的概念，而不是由系统构建者自行创建。

Xqerl – Erlang XQuery 3.1 处理器 Xqerl – Erlang XQuery 3.1 Processor 12 天前

## xqerl: Erlang XQuery 处理器 xqerl 是一个全新的、自包含的 XQuery 3.1 处理器和 XML 数据库，使用 Erlang 构建。它允许用户编写 XQuery 代码，然后将其编译为 Erlang 的 BEAM 字节码，从而实现可扩展和并发的应用程序。它可以嵌入到 Erlang/Elixir 项目中，也可以作为独立系统使用，提供通过 XQuery 和 RESTXQ 注解定义的 REST API 功能。目前正在积极开发中，xqerl 通过了大量的 W3C 和 EXPath 测试用例（超过 30,000 个）的 100%，但它缺少一些功能，例如模式感知和全文扩展。它有意避免 GUI 或 Web 界面，专注于规范符合性，以实现从其他 XQuery 处理器移植代码。主要功能包括 XQuery 模块和函数的预编译，用于通过 `xqldb_dml` 进行数据加载/删除。目前通过 `rebar3` 从源代码构建，未来计划提供打包版本。该项目欢迎贡献——从代码和文档到通过 Twitter (@xqerl) 和 Slack (xqerl.slack.com) 进行社区参与。

一个名为“xqerl”的新Erlang XQuery 3.1处理器最近在Hacker News上分享，引发了关于XQuery语言的讨论，该语言功能强大但未被广泛采用。用户强调了XQuery对树结构的优雅处理，因为XML是第一类数据类型，使其非常适合复杂的数据操作，而无需专门的工具。一些评论者分享了实际应用，包括使用XQuery生成整个网站以及将其用于ETL管道，甚至扩展到3.1版本中的原生JSON支持。虽然有人指出该项目似乎已停止维护（最后更新于3年前），但提到了BaseX等替代方案。讨论的用例包括转换和修复来自第三方服务的格式错误的XML负载，并具有存储转换以进行审计的优势。尽管有些人觉得它“不令人愉快”，但XQuery提供了一种函数式的数据转换方法，一些人认为它优于XSLT。

显示HN：埃普斯坦文件已整理并可搜索 Show HN: Epstein Files Organized and Searchable 12 天前

你需要启用 JavaScript 才能运行此应用。

Mentra (YC W25) 正在招聘：增长负责人，助力智能眼镜普及。 Mentra (YC W25) Is Hiring: Head of Growth to Make Smart Glasses Mainstream 12 天前

Mentra 正在开发下一代智能眼镜的操作系统，旨在创造变革性的计算体验——设想一个技术赋能人类能力，例如实时字幕和人工智能辅助沟通的未来。他们正在寻找增长负责人，以推动采用并确立 Mentra 作为智能眼镜领域的领导者。该职位重点关注两个关键指标：MentraOS 的每周活跃用户数和智能眼镜的销量。成功包括一个繁荣的开发者社区、重要的 B2B 订单、病毒式营销以及有影响力的应用案例，例如为 10 万名听障人士提供实时字幕。增长负责人将负责产品增长战略，领导内容创作（包括视频、网站、公关和广告），并管理营销渠道，如电子邮件、社交媒体和联盟计划。他们需要拥有经过验证的增长记录、广泛的技能组合以及对智能眼镜潜力的坚定信念——同时需要位于旧金山。

黑客新闻新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 Mentra (YC W25) 正在招聘：增长负责人，让智能眼镜普及 (ycombinator.com) 1天前 | 隐藏指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系搜索：

改变一切的意外点击：Apify的起源故事 The accidental click that changed everything: the Apify origin story 12 天前

## Apify的故事：解锁网络 Apify 始于 2014 年，当时人们意识到一个日益严重的问题：虽然网络变得越来越动态和用户友好，但计算机访问其底层数据的难度也在增加。创始人 Jan Čurn 和 Jakub Balada 最初是布拉格查理大学的学生，他们早期就有构建数据提取工具的经验，但最终未能获得成功。几年后，在咨询工作中，他们面临同样的挑战——现有的网络抓取工具不足以应对复杂的、JavaScript 密集的网站。这激发了 Apify 的想法：一种允许开发者使用 JavaScript 轻松构建自定义网络抓取器的工具。他们使用 PhantomJS（一种无头浏览器）开发了一个原型，并意外地在提前提交申请后获得了 Y Combinator 的席位。这个密集的项目推动了快速开发，最终在 2015 年 10 月在 Hacker News 上发布了 Apify，吸引了早期用户并验证了他们的愿景。最初名为“Apifier”，他们最终获得了首选的“Apify”域名。从解决个人困扰的方案，Apify 发展成为一项云服务，它赋予开发者解锁网络数据的能力，将网站转化为可访问的 API。

这个Hacker News讨论围绕一篇分享Apify（apify.com）起源故事的文章。文章详细描述了一个简单的草稿应用意外提交如何导致了公司的成立。用户们争论“Apify”这个名字，有人质疑为什么不是“Appify”。另一位用户解释说这是一个双关语——“API-ify”，指的是平台对API的关注。许多评论员称赞Apify是一个有用的产品，并强调了与创始人的积极体验，回忆起过去收到的帮助。一个有趣的讨论围绕着特斯拉不断延期的自动驾驶技术展开，并以幽默的方式将时间线延伸到遥远的未来，甚至建议飞行汽车可能会先出现。最后，一个简洁的“tl;dr”总结了核心故事：一次错误的提交引发了一切。

休斯顿，我们有麻烦了：Anthropic 乘着人工智能的浪潮 – BIML Anthropic Rides an Artificial Wave 12 天前

这篇文章批判了围绕Anthropic声称发现“首次人工智能策划的网络间谍活动”的炒作。作者认为，报道中的攻击依赖于现成的开源工具和蛮力方法——这些技术已经驱动网络犯罪多年——而不是独特的“自主型人工智能”能力。核心问题是媒体甚至安全专业人员在网络安全*和*人工智能/机器学习方面的综合专业知识不足，导致不加批判的报道。作者强调需要具体的证据（“给我看日志！”），并警告不要将大型语言模型（LLM）人格化，它们擅长*模拟*角色，但缺乏真正的意图。最终，作者驳斥了这一说法被夸大，指出自动化攻击已经存在了几十年。虽然承认机器学习安全的重要性，但他们提倡一种脚踏实地、现实的方法，超越耸人听闻的叙述。

## AI驱动的黑客攻击与安全问题 - 摘要 Hacker News上的讨论强调了人们对人工智能快速发展，特别是像Anthropic的Claude这样的大型语言模型（LLM）对网络安全的影响日益增长的担忧。一家构建AI驱动的渗透测试代理的初创公司报告称，每次Claude迭代（从Sonnet 3.5到4.5）都实现了显著的能力飞跃，甚至在一个小时内在一个实时网络上实现了权限提升。核心担忧在于，人工智能正在降低复杂网络攻击的门槛。虽然没有引入*新的*攻击方法，但它极大地提高了速度、规模和自动化程度，使技术水平较低的攻击者能够执行复杂的行动。专家们担心攻击者和防御者之间即将爆发一场军备竞赛，AI代理可能会绕过杀毒软件并自动化漏洞利用。对话还涉及攻击者使用领先（且昂贵）的美国AI模型，而存在可比较的中国选择的讽刺，以及对提高安全专业知识的需求。一些人建议专注于使用AI代理进行“CTF式”演练，以主动寻找漏洞，而不是仅仅依赖传统的报告。关于开源AI开发是否受到封闭、商业驱动的模型阻碍，以及AI可能加剧现有安全挑战的潜力，存在争论。

赞美午餐阿姨们 All praise to the lunch ladies 12 天前

这篇报道强调了学校午餐工作人员在支持学生方面所扮演的重要且常常被忽视的角色，他们提供的不仅仅是食物。在面临经济差距的城镇——例如现在成为度假胜地的佐治亚州蓝岭镇——学校午餐为可能缺乏家庭资源的儿童提供稳定和社区。像佐治亚州的玛莎·威廉姆斯和吉吉·托马斯，以及田纳西州的赛伯-加兰德这样的敬业员工，付出了额外的努力。她们记住学生的喜好，提供情感支持，甚至悄悄地确保孩子们有足够的食物，有时会自己承担费用或利用“分享桌”来减少浪费并帮助有需要的人。这些午餐工作人员将他们的工作视为为学生创造一个安全和关爱的“咖啡馆”，成为他们生活中一贯的积极力量。她们的奉献精神体现了一种足智多谋和坚定关怀的精神，呼应了作者祖母的建议：“尽你所能。”

## 美国学校午餐困境一篇最近在Hacker News上被重点介绍的文章引发了关于美国学校午餐质量的讨论，将其与其它国家更营养的选择进行对比。虽然许多人 fondly 回忆起午餐阿姨们努力提供美味食物，但目前的现实往往涉及预算限制和严格的联邦指导方针，导致孩子们经常浪费难以下咽的加工食品。评论者分享了个人经历，指出随着时间的推移质量下降，以及米歇尔·奥巴马的“Let’s Move”运动的影响，尽管该运动善意满满，但有时却导致食物 менее привлекательной（因此被浪费）。人们对政府资金不足以及将法规置于实际营养之上表示担忧。对话还涉及历史背景，包括黑豹党免费早餐计划在促成联邦午餐计划中的作用，以及午餐工作人员面临的挑战。许多人强调了午餐阿姨们的奉献精神以及支持她们的必要性，而另一些人则指出了劳动力成本和农业行业影响等系统性问题。最终，这场讨论强调了对更健康、更美味的学校午餐的渴望，以及对系统内优先事项的重新评估。

展示HN：Chirp – 使用ParakeetV3的本地Windows语音输入，无需可执行文件 Show HN: Chirp – Local Windows dictation with ParakeetV3 no executable required 12 天前

## Chirp：Windows本地快速语音听写 Chirp是一款注重隐私的Windows语音听写应用，完全本地运行，仅需Python即可，无需任何可执行文件。它利用ParakeetV3语音转文本（STT）引擎，提供与OpenAI的Whisper-large-V3相媲美的准确性，但速度**快17倍**，并且仅使用**CPU运行**（Whisper通常需要GPU）。 Chirp具有高度可配置性，允许用户自定义热键（默认：Ctrl+Shift）、语言和后处理样式。它还具有剪贴板管理、音频反馈和自定义词汇覆盖（例如，将“parrakeat”纠正为“parakeet”）等功能。该应用利用ONNX进行高效处理，并提供设置来控制线程使用和模型量化，以优化性能。Chirp通过将所有处理保留在用户机器上，优先考虑用户控制和隐私。

## Chirp：使用ParakeetV3的本地Windows语音听写 Chirp是一款新的Windows语音听写应用，专为禁止安装可执行文件的受限环境设计。由开发者whamp创建，它使用英伟达的ParakeetV3模型提供准确、快速且*本地*的语音转文本功能——仅需Python环境，无需`.exe`文件。 Chirp旨在解决基于云的听写和资源密集型设置的局限性。它利用ONNX Runtime，优先使用CPU以提高速度和可访问性。用户可以通过`config.toml`文件配置设置，例如热键、模型选择和词语覆盖。虽然Parakeet V3的准确性可与Whisper-large-v3媲美，但它在CPU上的性能明显更快。开发者正在寻求来自受限环境用户、熟悉Parakeet/Whisper/ONNX的用户以及有特定功能需求的用户反馈。许多评论者分享了类似的macOS和Linux项目，强调了Whisper和MacWhisper等工具的优势。该项目在GitHub上可用：[https://github.com/Whamp/chirp](https://github.com/Whamp/chirp)。

每日HackerNews RSS