每日HackerNews RSS

## AI进步停滞:从推理到资源工具的使用 最近的AI进展,例如OpenAI的o1,并非在*思考*方面的突破,而是在*工具使用*方面的进步。这些模型不是在内部解决问题,而是生成代码来委派任务——网络搜索、计算等——有效地成为复杂的协调者,而不是真正智能的系统。 这种趋势在GPT-5中延续,它在核心代码生成方面几乎没有改进,而代码生成是驱动所有后续能力的基础。 OpenAI的转变反映了这种停滞。他们正在从基础研究转向应用——应用商店(ChatGPT Apps)和消费产品(Atlas Browser)——优先考虑盈利,而不是模型改进。这可能是由于达到规模限制,或者仅仅是认识到应用更有利可图。 核心问题在于大型语言模型(LLMs)的底层架构。由于分词和有限的上下文窗口,它们难以进行语义理解,需要像工具使用这样的变通方法。真正的进步需要架构创新——例如基于图的系统或稀疏注意力——来保存信息,而不是压缩信息。 AI的未来取决于这个选择:继续在有缺陷的基础上构建,还是投资于根本新的方法。AI编码工具的爆炸式增长依赖于持续的模型改进,而未能实现改进可能会危及预计的3万亿美元的经济影响。

## Hacker News 讨论摘要:LLM 中的推理 vs. 工具使用 这次 Hacker News 讨论围绕一篇博文展开,该博文认为近期大型语言模型 (LLM) 的进步并非真正的“模型改进”,而是巧妙的工程规避,具体依赖于工具使用(如 Python 解释器),而非固有的推理能力。 作者质疑像 o1 这样的模型是否真的*计算*,还是仅仅生成代码来解决问题,并认为基础代码生成能力已经达到瓶颈。许多评论者不同意,他们举例说明 GPT-5 和 Claude 等模型在*没有*工具的情况下也能在编码方面表现出色,并指出工具的显著改进本身就是一项关键进展。 核心争论在于,将任务委托给工具是弱点的表现,还是模仿人类智能的复杂策略。一些人认为,工具使用扩展了 LLM 的能力,并能产生更可靠的结果,而另一些人则认为真正的进步在于提高模型内部的推理能力。 还有关于替代架构的讨论,以及当前方法是否正在达到极限。 最终,这次对话突出了模型架构、工具使用以及追求通用人工智能之间复杂的关系。

## TOMMY:基于Wi-Fi的运动感应 TOMMY通过将现有Wi-Fi设备(ESP32、ESP8266等)转化为强大的穿墙运动传感器,重新定义了运动检测。与传统的红外 PIR 传感器不同,TOMMY即使在存在障碍物的情况下也能检测到运动,仅需两个设备即可为每个区域提供灵活的全房间覆盖。 它通过分析Wi-Fi信号的干扰来工作——运动会改变信号模式,TOMMY的算法会将这些模式解释为运动,并将更新报告给Home Assistant或Matter生态系统。安装通过Docker或作为Home Assistant插件非常简单,并提供用户友好的仪表盘,用于设备固件刷新和区域配置。 目前处于免费Beta阶段,TOMMY提供无限设备和区域,并定期更新。Discord社区成员可以获得终身许可。虽然目前它可以检测所有运动,但未来的更新旨在包括宠物过滤和静止存在检测。重要的是,TOMMY优先考虑隐私,完全本地运行,无需互联网连接。 **开始使用:** [链接] **加入社区:** [链接]

## OS/2 显示驱动程序演变:摘要 为虚拟化的 OS/2 开发高分辨率显示驱动程序很复杂,原因是驱动模型历史碎片化。从 OS/2 1.x 的简单 16 位汇编驱动程序(克隆自 Windows 2.x)到 OS/2 2.x 不断发展的环境,IBM 经历了快速变革时期。早期版本依赖于直接链接到 `DISPLAY.DLL`,而后来的 2.x 版本引入了用于 DOS 支持的虚拟设备驱动程序 (VDD)。 一个关键的转变是 OS/2 2.00.1 中的 32 位图形引擎,它实现了 32 位驱动程序和调色板管理器、无缝 Win-OS/2 集成等功能。IBM 开发了几个 32 位驱动程序,包括 IBMVGA32 和合并的 XGA/8514/A 驱动程序,以及一个不断发展的驱动程序开发工具包 (DDK),其文档版本混乱。 Warp 3 引入了 SOFTDRAW,这是一种软件光栅化器,通过卸载位图绘制来简化驱动程序开发。Warp 4 最终确定了 GRADD(图形适配器设备驱动程序)模型,提供了一种简化的方法和统一的驱动程序基础。 如今,对于 OS/2 2.00.1+,Warp 4 DDK 中的 32 位合并 S3 驱动程序是最实用的起点。早期版本需要 16 位汇编驱动程序,缺乏 SVGA 支持。一个有趣的脚注是嵌入在较旧驱动程序中的未完成的 Matrox 支持代码,暗示了潜在的、未实现的硬件兼容性。

## OS/2 显示驱动程序动物园:对计算底层技术的怀旧一瞥 最近的 Hacker News 讨论围绕着 OS/2 显示驱动程序的复杂性展开,起因是帖子链接到一篇详细介绍“OS/2 显示驱动程序动物园”的文章 ([os2museum.com](https://os2museum.com))。用户分享了让 OS/2 与各种硬件协同工作的令人沮丧但有时又令人满意的经历。 对话表明,驱动程序开发已经发生了显著的演变。早期的驱动程序,特别是针对 OS/2 和 Windows 的驱动程序,体积庞大,通常超过 5MB 的汇编代码才能实现基本功能。 后来的 OS/2 GRADD 驱动程序简化了这一过程,仅用几千字节的 C 代码就能实现类似的结果。 参与者回忆起实现基本分辨率的挑战以及克服这些障碍的成就感。 讨论还涉及了设备驱动程序在现代计算中至关重要但常常被低估的作用,将其比作“卫生下水道系统”——至关重要但看不见。 一些人表达了对 OS/2 回归的渴望,承认它在满足现代软件需求方面存在局限性。

## 红杉材料:超越电池回收——电动汽车的第二次生命 红杉材料,电动汽车电池回收领域的领导者,正在拓展一项新业务:**红杉能源**,旨在将二手电动汽车电池重新用于电网规模的储能。红杉材料将利用电池剩余的容量,而不是立即回收,从而有效地提取每一份价值后再进行材料回收。 这种“第二次生命”方法,过去因电池异构性而受阻,现在由于红杉材料创新的“通用翻译器”——能够使不同电池组协同工作的软硬件而变得可行。该公司已经建成了一个由太阳能和63兆瓦时二手电池供电的试点设施,为两个数据中心提供支持。 红杉材料认为,这种方法不仅可行,而且*在经济上更有优势*,可能优于新的电池储能系统,尤其是在较长时间的储能(8小时以上)方面。他们正在迅速扩大规模,预计随着电动汽车的普及,电池供应量将激增,并设想从离网解决方案到并网储能等各种项目。 最终,红杉材料旨在为电池材料创建一个循环经济,减少对新资源开采的依赖,并建立一种可持续、具有成本效益的储能解决方案。他们预计将实现显著增长,其规模可能与或超过其回收业务。

## iOS 26 与 macOS 26:UI/UX 灾难 苹果最新操作系统 iOS 26 和 macOS 26 的更新,引入了大量令人沮丧的设计缺陷,而非修复现有问题。作者详细描述了一系列问题,从核心应用(如日历)中不一致的标签设计开始,到 Finder 几乎无法使用的搜索栏。 iOS 26 问题尤为突出。文件应用在深色模式下存在可见性问题,而共享表显示损坏的应用图标。启用“降低透明度”可以提供临时修复,但会引入新的视觉故障——例如提醒事项中持续存在的黑色条纹和扭曲的文件夹外观。 第三方浏览器受到 WebKit 问题的限制,导致自动填充问题和视口扭曲,甚至影响苹果自己的 Safari,出现闪烁的按钮和滚动内容问题。“液态玻璃”设计进一步加剧了问题,使 iMessage 中的文本难以阅读,并使 App Library 中的应用图标显示不一致。 最终,作者认为这些变化反映了苹果日益增长的反竞争行为以及对用户体验、可访问性和甚至内部设计一致性的漠视。这次更新问题重重,是一次全面的设计失败。

启用 JavaScript 和 Cookie 以继续。

## OpenAI 收购 Sky.app:摘要 OpenAI 收购了 Sky.app,这是一款由最初 iOS Shortcuts 应用团队开发的、专注于 macOS 的 AI 界面。 这次收购看起来主要是一次“收购人才”,旨在将熟练的 macOS 开发者带入 OpenAI,以增强 ChatGPT 与该操作系统的集成。 围绕该交易的讨论强调了苹果公司可能错失的机会,一些人认为苹果*应该*收购 Sky 来增强 Siri 或 Spotlight。 还有猜测认为 OpenAI 旨在抢先在 macOS 生态系统中扎根,以防苹果公司可能限制访问。 评论员们争论 OpenAI 的收购策略,一些人认为这表明 OpenAI 停滞不前,并且依赖于购买创新而不是内部构建。 另一些人则指出谷歌和微软等公司的成功收购案例,作为一种可行的增长策略的证据。 这次收购也引发了关于苹果公司在 AI 采用方面进展缓慢以及其以控制为中心的策略的讨论,这可能会阻碍创新。 最终,这一举动被视为 OpenAI 加强其在苹果平台上的影响力的战略举措。

## 技术与商业亮点 – 2025年10月23日 近期新闻显示科技领域快速发展和法律挑战并存。有传言称苹果正在开发用于iPhone 18的突破性2纳米A20芯片,并可能收购华纳兄弟探索公司以加强Apple TV+。与此同时,英国监管机构因App Store滥用行为对苹果处以20亿美元罚款。 人工智能继续占据头条。Anthropic升级了Claude的内存,微软以一个类似Clippy的头像重新设计了Copilot,OpenAI推出了ChatGPT Atlas,这是一款人工智能驱动的浏览器。然而,一起诉讼指控ChatGPT导致一名青少年自杀,引发了对人工智能伦理的严重担忧。Reddit也正在起诉人工智能公司,指控其抓取用户数据。 其他关键发展包括谷歌利用Gemini人工智能增强地球,三星发布Galaxy XR头显,以及特斯拉尽管电动汽车销量创纪录但利润却在下降。多家公司正在获得融资——Paygentic(200万欧元)、Kotcha(350万欧元)和Rightcharge(金额未公开),同时谷歌和特朗普政府正在探索对量子计算的投资。最后,通用汽车将放弃对CarPlay和Android Auto的支持,转而支持专有系统。

## Deadstack.net:一个技术新闻聚合器总结 Dreadsword 启动了 deadstack.net,一个技术新闻聚合器,优先考虑简洁、快速和非算法的反向时间线推送。这是一个基于 LAMP 栈构建的个人项目,并利用 LLM (o3-mini) 来总结和分类新闻。 该网站提供 LLM 策划的“热门”视图、分类视图,并注重速度和简洁性。“最近文章摘要”的可读性问题是最初的反馈重点——特别是间距和字体选择——促使创建者将文章标题调整为黑色。进一步的讨论围绕链接设计、“传入/传出”文章的含义,以及对自动阅读状态跟踪和 RSS 源等功能的需求。 创建者正在积极寻求反馈并迭代设计,强调对简洁性的偏好,并避免用户帐户或无限滚动等功能。 许多评论者分享了类似的项目,突显了对精简新闻聚合的需求。

## OpenMaxIO 控制台摘要 OpenMaxIO 控制台是 MinIO 控制台的一个社区驱动的分支,旨在维护一个完全开源的对象存储管理界面。它源于 MinIO 的变更,将核心功能移至商业许可之下。该项目旨在保留原始的极简主义、性能和自由原则。 要使用它,克隆仓库,检出 1.7.6 版本,使用 `yarn` 安装依赖项,并构建 Web 应用。它需要一个正在运行的 MinIO 服务器(例如 `http://1.2.3.4:9000`)和一个具有管理员权限的 MinIO 用户——通过 `mc` 命令创建用户并分配管理员策略。 控制台通过 `./console server` 启动,需要环境变量用于 JWT 加密 (`CONSOLE_PBKDF_PASSPHRASE`, `CONSOLE_PBKDF_SALT`) 和 MinIO 服务器地址 (`CONSOLE_MINIO_SERVER`)。它默认使用 9090 端口,并支持使用自定义证书的 TLS。可以通过 `CONSOLE_DEBUG_LOGLEVEL` 启用调试日志。欢迎对该项目做出贡献。

请启用 JavaScript 并禁用任何广告拦截器。

## 体育博彩与潜在腐败:摘要 近期《纽约时报》的一份报告详细介绍了涉及职业运动员的赌博案件以及涉嫌与黑手党有关联的情况,引发了对合法体育博彩影响的讨论。核心问题在于,体育联盟与博彩公司(如FanDuel和BetMGM)之间的合作,虽然能短期内增加收入,但也为球员们破坏比赛公正性创造了巨大的诱惑。 评论员指出,体育博彩并非新事物——它长期存在于全球,甚至在美国也通过黑帮进行——但目前的规模和可及性令人担忧。一些人担心未来球迷会不信任比赛的真实性,可能导致收视率下降到与职业摔跤相当的水平。 该案件涉及指控使用先进技术(如特殊隐形眼镜)作弊的纸牌游戏,以及与NBA人物如昌西·比卢普斯有关联。虽然一些人认为应该将赌博的各个方面都合法化,包括作弊,但另一些人强调更广泛的问题,如欺诈、敲诈勒索以及对体育信任的潜在侵蚀。讨论还涉及加强监管的必要性,将美国的零散体系与英国更完善的框架进行比较。

```typescript export async function welcome(userId: string) { "use workflow"; const user = await getUser(userId); const { subject, body } = await generateEmail({ name: user.name, plan: user.plan }); const { status } = await sendEmail({ to: user.email, subject, body, }); return { status, subject, body }; } ``` 导出异步函数 welcome(userId: string) { "use workflow"; const user = await getUser(userId); const { subject, body } = await generateEmail({ name: user.name, plan: user.plan }); const { status } = await sendEmail({ to: user.email, subject, body, }); return { status, subject, body }; }

## Vercel 的 “use workflow” – 具有容错机制的函数 Vercel 推出了一套名为 “workflow” 的新系统,旨在使 TypeScript 函数具有持久性,从而实现自动重试和确定性执行等功能。这是通过一种新颖但备受争议的语法实现的,该语法在函数定义中使用 “use workflow” 等指令。 这一发布引发了争论,许多开发者批评这种“魔术字符串”方法不够优雅,并且可能阻碍调试和工具支持。人们担心会像他们的 “use client” 和 “use server” 指令一样,被锁定在 Vercel 生态系统中。虽然 Vercel 声称该系统可以通过 “World” 接口进行调整,以允许使用不同的数据存储,但初始实现很大程度上依赖于 Next.js 和 DynamoDB。 讨论还涉及装饰器、高阶函数以及 Temporal 和 Cloudflare Workflows 等现有解决方案等替代方案。有些人将其与状态机概念相提并论,而另一些人则质疑增加复杂性的必要性,提倡更简单、更明确的方法。该项目被认为是早期阶段,关于状态管理、更新和配置等方面仍存在疑问。

更多

联系我们 contact @ memedata.com