## 迭代鹈鹕:测试人工智能的自我提升 Simon Willison 的“骑自行车鹈鹕” SVG 基准测试——一项出人意料地能洞察人工智能创造力的测试——激发了一项探索*自主*人工智能力量的实验。六个领先的多模态模型(Claude、GPT-5、Gemini)没有被单个提示所限制,而是被要求使用视觉能力,通过生成-评估-改进的循环迭代地改进它们最初的 SVG 作品。 这些模型使用 Chrome DevTools 将 SVG 转换为 JPG 以进行视觉评估,然后根据它们“看到”的内容进行自我修正。结果差异很大。Claude Opus 4.1 展现了令人印象深刻的推理能力,添加了诸如自行车链条之类的现实细节。其他模型,例如 Claude Sonnet,则专注于细微的改进。Gemini 2.5 Pro 在迭代过程中彻底改变了其最初的构图。 有趣的是,GPT-5-Codex 似乎将复杂性等同于改进,创建了越来越精细(但并非一定*更好*)的图像。该实验表明,虽然自主循环产生的结果与零样本生成不同,但真正的自我提升需要的不仅仅是视觉——它还需要审美判断以及知道何时足够的能力。这揭示了一套与最初的创造性生成不同的技能。
## Dynalang:一种用于世界理解的语言增强智能体
Dynalang是一种新颖的智能体,它学习理解和利用多样化的语言——超越简单的指令——以有效地与世界互动并预测其未来状态。与仅关注动作预测的传统智能体不同,Dynalang利用语言构建多模态世界模型,同时预测未来的文本、图像和奖励。
这种“未来预测”方法使Dynalang能够从各种语言类型中学习,例如环境描述、游戏规则和交互反馈,甚至无需明确的任务特定训练。它可以仅在文本和视频数据上进行预训练,从而提高其在强化学习环境中的性能。
Dynalang在需要多步推理和导航的复杂任务中始终优于现有方法,包括模拟家庭环境(HomeGrid)和照片级真实场景(Habitat)。此外,它还展示了语言生成能力,将理解和创造统一在一个模型中。这项工作强调了将语言整合到世界建模中,以构建更强大和适应性更强的AI智能体的力量。
## .NET MAUI 通过 Avalonia 后端获得新生
由 Avalonia 驱动的新后端将 .NET MAUI 带到 Linux 和浏览器,扩展了其平台覆盖范围并提高了桌面性能。该项目源于实验,现在已成为一项承诺,允许开发者无需重写即可为新平台利用现有的 MAUI 代码库。
主要优势包括对 Linux(Ubuntu、Debian、Fedora)和嵌入式 Linux 设备的本机桌面支持,以及在浏览器中直接运行 MAUI 应用程序的功能性 WebAssembly 演示。在测试中,macOS 上的性能提升已经显现,超过 Mac Catalyst 超过 2 倍。
Avalonia 后端采用绘制 UI 模型,确保在所有平台(Windows、macOS、Linux、移动设备和 Web)上保持一致的外观和感觉。这简化了开发,因为它专注于单个目标并减少了平台特定问题。Avalonia 团队旨在通过这种统一的方法来加速开发并提高可靠性。
最终,这项合作旨在解决长期以来对 Linux 支持和跨平台一致 UI 的要求,同时通过洞察力和潜在的新用户使 Avalonia 受益。未来的开发包括与 Google 的 Impeller GPU 渲染器的集成,以实现更大的性能改进。现在开放早期访问注册。
## 伦敦的罗马城墙:意想不到的发现
伦敦的罗马城墙在塔山和巴比肯等知名地点可见,但一些最有趣的遗迹却隐藏在显而易见的地方。令人惊讶的是,一部分可以在**塔山站1号站台**看到,尽管在1882年环线建设期间拆除了22米。另一段可达到的城墙位于**莱昂纳多皇家酒店**后面,你甚至可以穿过一个中世纪重建的城墙,它融合了原始的罗马地基。
最近,**芬街的城墙**提供了一个保存完好的视角,位于学生公寓下方,独特地与一家供应咖啡和早午餐的咖啡馆结合在一起。最不寻常的地点可能是**伦敦墙地下的停车场**,那里有一段相当长的城墙被混凝土块保护着,与现代车辆和安全标志并存。
这些奇特的地点突出了城墙持久的存在,证明了伦敦的历史常常隐藏在城市意想不到的,有时甚至是格格不入的角落里。