每日HackerNews RSS

## 迭代鹈鹕:测试人工智能的自我提升 Simon Willison 的“骑自行车鹈鹕” SVG 基准测试——一项出人意料地能洞察人工智能创造力的测试——激发了一项探索*自主*人工智能力量的实验。六个领先的多模态模型(Claude、GPT-5、Gemini)没有被单个提示所限制,而是被要求使用视觉能力,通过生成-评估-改进的循环迭代地改进它们最初的 SVG 作品。 这些模型使用 Chrome DevTools 将 SVG 转换为 JPG 以进行视觉评估,然后根据它们“看到”的内容进行自我修正。结果差异很大。Claude Opus 4.1 展现了令人印象深刻的推理能力,添加了诸如自行车链条之类的现实细节。其他模型,例如 Claude Sonnet,则专注于细微的改进。Gemini 2.5 Pro 在迭代过程中彻底改变了其最初的构图。 有趣的是,GPT-5-Codex 似乎将复杂性等同于改进,创建了越来越精细(但并非一定*更好*)的图像。该实验表明,虽然自主循环产生的结果与零样本生成不同,但真正的自我提升需要的不仅仅是视觉——它还需要审美判断以及知道何时足够的能力。这揭示了一套与最初的创造性生成不同的技能。

## Agentic Pelican 实验总结 这次Hacker News讨论围绕罗伯特·格拉瑟的实验,展示了使用LLM迭代生成图像,创造一只骑自行车的鹈鹕图片。作者测试了Claude模型(Opus表现最佳)和其他模型,提示它们在多次迭代中完善图像。 一个关键的争论点是,生成的图像,甚至文章本身,是人类生成的还是AI生成的。许多评论者表达了对LLM生成文本日益公式化的风格感到疲惫,注意到诸如过度使用破折号和对比性短语等模式。 进一步的讨论集中在当前LLM的局限性上——倾向于在有缺陷的方法上迭代,而不是从根本上进行修改,以及难以处理复杂的构图。一些人建议使用遗传算法方法或独立的评估代理。一个反复出现的主题是,LLM擅长生成,但难以进行有意义的修改,仅仅添加细节并不等同于提高连贯性或理解力。最后,一些评论员指出,通过在特定图像上预训练模型,存在“作弊”的可能性。

## Dynalang:一种用于世界理解的语言增强智能体 Dynalang是一种新颖的智能体,它学习理解和利用多样化的语言——超越简单的指令——以有效地与世界互动并预测其未来状态。与仅关注动作预测的传统智能体不同,Dynalang利用语言构建多模态世界模型,同时预测未来的文本、图像和奖励。 这种“未来预测”方法使Dynalang能够从各种语言类型中学习,例如环境描述、游戏规则和交互反馈,甚至无需明确的任务特定训练。它可以仅在文本和视频数据上进行预训练,从而提高其在强化学习环境中的性能。 Dynalang在需要多步推理和导航的复杂任务中始终优于现有方法,包括模拟家庭环境(HomeGrid)和照片级真实场景(Habitat)。此外,它还展示了语言生成能力,将理解和创造统一在一个模型中。这项工作强调了将语言整合到世界建模中,以构建更强大和适应性更强的AI智能体的力量。

一个黑客新闻的讨论集中在掌握语言预测可能是实现通用人工智能(AGI)的关键。 初始帖子链接到“用语言模拟世界”(dynalang.github.io),引发了关于真正预测语言是否需要对它所代表的世界有深刻理解的讨论。 一位评论者分享了一篇相关的2020年OpenAI研究论文,“使用语言模型构建AGI”,该论文正是认为完善语言预测*是*实现AGI的途径。 另一位用户对此进行了扩展,指出语言可以描述虚构的世界,从而引发了一个问题:AGI是否需要理解*所有*世界,无论是真实的还是想象的,才能有效地预测语言。 这场讨论突出了语言、理解以及创造真正智能机器之间的复杂关系。

## .NET 10 现已在 Heroku 上可用 .NET Conf 2025 发布了 .NET 10,以及 ASP.NET Core 10、C# 14 和 F# 10。Heroku 现在支持使用 .NET 10 构建和运行应用程序,提供对最新功能的即时访问。值得注意的是,.NET 10 是一个长期支持 (LTS) 版本,保证三年支持,使其非常适合生产环境。 此版本意义重大,因为 .NET 8 和 9 将于 2026 年 11 月 10 日停止支持,促使现有用户制定迁移时间表。Heroku 将继续支持 .NET 8 和 9 以及 .NET 10,遵守官方 .NET 支持策略。 主要功能包括 **基于文件的应用程序** – 单文件 .NET 应用程序,用于简化、零配置部署 – 以及采用现代 **.slnx** 解决方案文件格式。Heroku 完全支持 .sln 和 .slnx 格式,并与 .NET 10 SDK 中包含的新 Microsoft 测试平台集成。 已更新文档和资源,包括更新的入门指南,可帮助进行迁移。

## Hacker News 上关于 Heroku 和 .NET 10 的讨论 最近 Hacker News 上出现了一场关于 Heroku 持续高定价的讨论,尽管已经增加了对 .NET 10 的支持。用户们哀叹 Heroku 的衰落,指出它已经变得过于昂贵,只适合业余项目——通常比 AWS 更贵,甚至*包括*了专门的 DevOps 人员。 这引发了关于替代方案的讨论。一些旨在重现 Heroku 简单性的项目被提及,包括 Canine.sh 和 Dokku。 还有人指出 Render.com 和 Fly.io 可能是 PaaS 模式的潜在演进。 讨论还涉及云定价的复杂性,一位创始人指出 Heroku(依赖 AWS)在实现更低成本方面存在固有的局限性。 原始发帖人强调了 Heroku 的开源 .NET Cloud Native Buildpack,可以免费在本地使用。 最后,一个反复出现的主题是微软历史上令人困惑的命名约定,特别是与 .NET 框架及其各种迭代版本有关。

地理和经济模式:最贫穷的国家更多依赖现金:缅甸(98%)、埃塞俄比亚(95%)和冈比亚(95%)位居榜首,反映了有限的银行基础设施。 富裕国家几乎无现金:瑞典(14%)、挪威(10%)和韩国(10%)表明,数字支付基础设施与经济发展相关。 新兴经济体如墨西哥(80%)、印度(70%)和泰国(65%)表明,现金使用率可能相当稳定。 令人惊讶的异常值:日本的60%对于这样一个技术先进的国家来说非常高——尽管基础设施完善,但仍然存在对现金的文化偏好。 德国的51%在富裕的欧洲国家中是一个异常现象,可能源于文化隐私问题。 意大利的62%在西欧脱颖而出,可能与非正规经济的盛行有关。 中国的10%引人注目——这反映了它跳过传统的银行卡基础设施,直接转向移动支付(支付宝/微信支付)。 谁还在使用现金? - Voronoi

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

## 黑客新闻讨论摘要:尼采与人工智能 一篇最近发表在ACM上的文章,探讨了尼采的哲学在人工智能时代的相关性,引发了黑客新闻上的一场长时间讨论。 讨论的共识严重批评了这篇文章本身,许多评论者认为它肤浅、研究不足,并且可能由人工智能生成,因为它缺乏深度和原创性。 几位用户指出了文章中的事实错误和缺乏支持的引用。 核心论点——人工智能的颠覆反映了“上帝已死”之后随之而来的文化动荡,正如尼采所描述的那样——被认为是一种薄弱的联系,缺乏对尼采作品的细致理解。 尽管对文章存在批评,但讨论强调了哲学与技术的结合的重要性。 评论员们争论尼采的概念,例如权力意志和在虚无主义世界中寻找意义,*是否*与应对人工智能带来的挑战相关,但他们认为这篇文章未能充分探讨这一点。 许多人建议选择德勒兹与加塔利或海德格尔等其他哲学家,他们会提供更有益的视角。 一个反复出现的主题是,对低质量、人工智能辅助内容日益普及的担忧,以及它可能稀释有意义的讨论的潜力。

## NeoClerks:寻求合作伙伴的AI化身平台 在伊朗面临经济困境和冲突的18个月里,一位开发者构建了NeoClerks——一个可投入生产的AI化身平台,可与Soul Machines媲美,但成本仅为后者的一小部分。该平台具有逼真的化身,支持47种语言的实时对话,强大的企业基础设施和全面的文档。 尽管技术上取得了成功,但由于国际制裁和当地经济崩溃,该开发者无法从伊朗实现盈利。由于无法访问支付处理方或云服务,并且在伊朗国内找不到可行的市场,他们正在寻求合作伙伴,将NeoClerks推向全球市场。 与竞争对手相比,该平台具有显著的成本优势,启动成本为0美元,而Soul Machines的启动成本为5万美元以上。该开发者对合作结构持开放态度,包括共同创立(股权分配)、长期合同的直接出售或收入分成模式。他们提供完整的代码库访问权限,并渴望继续构建,只需要合作伙伴来处理销售、Stripe访问和市场扩张。 这是一个获得一个经过全面开发且AI验证的平台的机会,该平台拥有21亿美元的市场机遇和潜在的快速投资回报。感兴趣的各方可以测试演示 ([https://neoclerks.com/en/](https://neoclerks.com/en/)) 并直接联系开发者。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 AV1 与 H.264:为您的应用选择哪个视频编解码器? (red5.net) 10 分,mondainx 1 天前 | 隐藏 | 过去的 | 收藏 | 2 评论 mondainx 1 天前 | 下一个 [–] 项目开始时的一个重要决定需要研究和理解编解码器的情况;这篇文章完成了一些前期工作。回复 shmerl 1 天前 | 上一个 [–] 现在?AV1 解码应该没问题。编码方面还需要更多考虑。如果可以的话 - 也使用 AV1。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## .NET MAUI 通过 Avalonia 后端获得新生 由 Avalonia 驱动的新后端将 .NET MAUI 带到 Linux 和浏览器,扩展了其平台覆盖范围并提高了桌面性能。该项目源于实验,现在已成为一项承诺,允许开发者无需重写即可为新平台利用现有的 MAUI 代码库。 主要优势包括对 Linux(Ubuntu、Debian、Fedora)和嵌入式 Linux 设备的本机桌面支持,以及在浏览器中直接运行 MAUI 应用程序的功能性 WebAssembly 演示。在测试中,macOS 上的性能提升已经显现,超过 Mac Catalyst 超过 2 倍。 Avalonia 后端采用绘制 UI 模型,确保在所有平台(Windows、macOS、Linux、移动设备和 Web)上保持一致的外观和感觉。这简化了开发,因为它专注于单个目标并减少了平台特定问题。Avalonia 团队旨在通过这种统一的方法来加速开发并提高可靠性。 最终,这项合作旨在解决长期以来对 Linux 支持和跨平台一致 UI 的要求,同时通过洞察力和潜在的新用户使 Avalonia 受益。未来的开发包括与 Google 的 Impeller GPU 渲染器的集成,以实现更大的性能改进。现在开放早期访问注册。

## FFmpeg 与开源资金危机 FFmpeg 是一款开源程序,驱动着互联网上大量的视频和音频处理——被 VLC 等播放器甚至 YouTube 使用——正处于一场辩论的中心,凸显了开源资金的脆弱性。尽管它被大型公司广泛使用,FFmpeg 几乎完全依赖于志愿者开发者。 最近由 Google AI 发现软件中一个小的漏洞引发的争议,暴露了这些志愿者的压力。许多人认为,像 Google 这样的公司将漏洞检测和修复转嫁给无偿维护者是不公平的,特别是随着 AI 工具产生大量潜在问题。Google 新的安全披露政策,推动快速公开报告,加剧了这种压力。 核心问题不在于*是否*应该修复漏洞,而在于*谁*应该承担成本。类似的担忧导致了另一个关键库 libxml2 的维护者因不可持续的工作量而辞职。如果没有资金支持,重要的开源项目面临被放弃的风险,这可能会给所有人带来重大的安全风险。这场辩论强调了公司投资于他们严重依赖的开源基础设施的日益增长的需求。

## 伦敦的罗马城墙:意想不到的发现 伦敦的罗马城墙在塔山和巴比肯等知名地点可见,但一些最有趣的遗迹却隐藏在显而易见的地方。令人惊讶的是,一部分可以在**塔山站1号站台**看到,尽管在1882年环线建设期间拆除了22米。另一段可达到的城墙位于**莱昂纳多皇家酒店**后面,你甚至可以穿过一个中世纪重建的城墙,它融合了原始的罗马地基。 最近,**芬街的城墙**提供了一个保存完好的视角,位于学生公寓下方,独特地与一家供应咖啡和早午餐的咖啡馆结合在一起。最不寻常的地点可能是**伦敦墙地下的停车场**,那里有一段相当长的城墙被混凝土块保护着,与现代车辆和安全标志并存。 这些奇特的地点突出了城墙持久的存在,证明了伦敦的历史常常隐藏在城市意想不到的,有时甚至是格格不入的角落里。

更多

联系我们 contact @ memedata.com