## HipKittens:弥合AMD AI软件差距
目前,AI开发受到硬件限制,扩大计算格局至关重要。虽然AMD GPU提供具有竞争力的性能,但其软件生态系统落后于NVIDIA,阻碍了其能力的充分利用。本文介绍**HipKittens**,这是一系列优化的AMD内核和编程原语,旨在简化和加速AMD GPU开发。
研究表明,现有的AMD软件(AITER、PyTorch、Triton、Mojo和TileLang等编译器)通常无法达到峰值性能,需要对低级汇编进行大量的手动优化——这是可扩展性的重大障碍。HipKittens通过利用NVIDIA开发中成功使用的**基于切片的抽象**(ThunderKittens),并将其适应于AMD独特的架构来解决这个问题。
主要发现表明,这些基于切片的原语在不同架构上具有良好的泛化性,能够实现可读、易于维护的代码,在注意力机制和GEMM操作中**优于AMD现有的基线**——包括手动优化的汇编内核。HipKittens旨在普及AMD GPU在AI中的使用,摆脱繁琐的汇编编程,为更加多样和开放的AI硬件生态系统铺平道路。代码和研究已公开发布。
## Gemini AI 能力的潜在飞跃
近期,用户在谷歌的 AI Studio 中发现,他们的 Gemini 模型,可能为 Gemini-3,正在进行 A/B 测试,并展现出显著的进步。用户报告称,该模型能够仅通过单个提示生成操作系统、3D 软件和模拟器的可用代码,能力出乎意料地强大。
值得注意的是,该模型在转录历史手稿方面表现出色,准确率接近专家水平——超越了之前的版本和专业软件。然而,最引人注目的发现是它*无需提示*即可执行复杂的推理。例如,在转录 18 世纪商人的账簿时,该模型正确推断出缺失的计量单位,并使用历史货币系统进行计算,展现了以往大型语言模型中从未见过的上下文理解能力。
这表明可能从模式识别转向真正的理解,暗示着随着规模和复杂性的增加,涌现出推理能力。虽然确切的机制尚不清楚,但这一飞跃可能会彻底改变需要视觉精度和推理的领域,例如历史研究,并可能预示着人工智能在从预测向真正理解方面取得更广泛的突破。其影响既令人兴奋,又可能具有颠覆性,表明人工智能可能比以前预期的更接近专家级别的推理能力。
## Apify的故事:解锁网络
Apify 始于 2014 年,当时人们意识到一个日益严重的问题:虽然网络变得越来越动态和用户友好,但计算机访问其底层数据的难度也在增加。创始人 Jan Čurn 和 Jakub Balada 最初是布拉格查理大学的学生,他们早期就有构建数据提取工具的经验,但最终未能获得成功。
几年后,在咨询工作中,他们面临同样的挑战——现有的网络抓取工具不足以应对复杂的、JavaScript 密集的网站。这激发了 Apify 的想法:一种允许开发者使用 JavaScript 轻松构建自定义网络抓取器的工具。
他们使用 PhantomJS(一种无头浏览器)开发了一个原型,并意外地在提前提交申请后获得了 Y Combinator 的席位。这个密集的项目推动了快速开发,最终在 2015 年 10 月在 Hacker News 上发布了 Apify,吸引了早期用户并验证了他们的愿景。
最初名为“Apifier”,他们最终获得了首选的“Apify”域名。从解决个人困扰的方案,Apify 发展成为一项云服务,它赋予开发者解锁网络数据的能力,将网站转化为可访问的 API。