我们检测到您的浏览器已禁用 JavaScript。请启用 JavaScript 或切换到受支持的浏览器以继续使用 x.com。您可以在我们的帮助中心查看受支持的浏览器列表。帮助中心 服务条款 隐私政策 Cookie 政策 版权信息 广告信息 © 2025 X Corp.
我们检测到您的浏览器已禁用 JavaScript。请启用 JavaScript 或切换到受支持的浏览器以继续使用 x.com。您可以在我们的帮助中心查看受支持的浏览器列表。帮助中心 服务条款 隐私政策 Cookie 政策 版权信息 广告信息 © 2025 X Corp.
## 全自动化令人惊讶的繁荣未来 尽管人们对失业的担忧,作者认为完全自动化很可能*提高*整体人类福祉。虽然工资可能会下降,但人工智能驱动的生产力激增将产生巨大的财富,远远超过目前的GDP。这种财富不会仅仅集中在少数人手中;历史先例,例如农业和工业自动化的影响,表明社会价值观的转变和增加社会福利。 就像自动化解放了儿童的劳动力一样,它也将解放成年人脱离工作,政府可能会扩大对那些不在传统就业之外的人的支持计划——这反映了一个世纪以来社会支出不断增加的趋势。这个未来设想的是由庞大的人工智能劳动力支持的一小部分人类人口,可能赋予每个人相当于“成千上万不知疲倦的仆人”。 至关重要的是,作者驳斥了富人会阻止财富再分配的观点,并引用证据表明富人的政治影响力有限,并且累进税制和社会计划已经普遍存在。这表明广泛的共同繁荣,以及技术进步的爆炸式增长——从先进的医学和虚拟现实到可能具有变革性的超出我们当前想象的创新——最终将带来生活水平的显著提高,甚至可能实现激进的人类增强。
## AI 代理的“jQuery 时代” 当前构建 AI 代理——将它们连接到工具和 API——的现状,与 2000 年代中期Web 开发的情况非常相似。 就像开发者们曾经为在不同浏览器上处理不一致的 JavaScript 实现而苦恼一样,我们现在正面临着将代理与各种服务集成这一支离破碎且具有挑战性的过程。 这导致了务实的、临时的“补丁”解决方案,仅仅为了*发布*产品。 模型上下文协议 (MCP) 登场,被比作 AI 领域的 jQuery。Anthropic 发布了 MCP,它提供了一个标准化的抽象层,简化了复杂的“N×M 集成问题”——即为每种代理-工具组合编写自定义代码的需求。 就像 jQuery 一样,它并不能*解决*根本问题,但可以使集成变得不那么痛苦,从而实现快速开发。 然而,AI 标准化的时间线比 Web 快得多,可能导致更快的融合*或*更多的碎片化。 关键在于,风险更高; 故障的代理可能会造成现实世界的损害,因此从一开始就需要强大的安全性。 虽然 MCP 具有早期势头,但来自 Google 的 Agent2Agent 和其他协议的竞争意味着标准化并非得到保证。 最终,MCP 代表了一种临时解决方案,允许在长期标准发展的同时进行创新——这种模式与 jQuery 对 Web 的影响相呼应。
启用 JavaScript 和 Cookie 以继续。
## Glyph:利用视觉压缩扩展长文本上下文
Glyph是一个新颖的框架,通过**将文本转换为图像**并使用视觉-语言模型(VLMs)进行处理,来解决大型语言模型(LLMs)中长文本上下文建模的挑战。这种“视觉文本压缩”与扩展传统的基于token的上下文窗口相比,显著降低了计算成本和内存需求,同时保持了语义信息。
Glyph在LongBench和MRCR等基准测试中实现了与基于文本的LLMs相媲美的性能,并展示了显著的加速效果——尤其是在预填充时间方面——对于128K token的输入。提供了一个演示,可以比较Glyph与Qwen3等模型的效率。
该框架基于GLM-4.1V-9B-Base构建,并可在Hugging Face上获取,允许自定义渲染参数(DPI、字体、换行标记)以优化压缩比。虽然渲染风格和复杂字符串的OCR挑战可能会影响性能,但Glyph提供了一种有前景的方法来扩展上下文窗口,有效地实现了与具有3-4倍更长上下文的LLMs相当的结果。
项目GitHub仓库中提供了更多细节、评估脚本和研究论文。
## Z80电视游戏:极简8位游戏机
Z80电视游戏是一款完全可用的8位游戏机,由一位日本爱好者于1987年从零开始制作,仅使用19个集成电路——没有专用图形芯片!它配备了4MHz Z80处理器、32KB ROM地址空间、16KB系统ROM和8KB视频RAM,输出168x210像素的黑白图形,刷新率为60Hz,音频为1位。
尽管结构简单,该游戏机却支持令人惊讶的复杂游戏。目前有26款游戏,由原始设计师创作,并由开发者Inufuto扩展,他使用跨平台编译器。
该系统设计易于理解,非常适合学习计算机视频信号生成。有各种可下载资源可用,包括原理图、PCB文件,甚至多卡带(可容纳最多16款游戏)和实验性256KB卡带扩展的设计。软件开发通过Z88DK、Cate和Cross-Lib等工具支持,允许使用C语言和Z80汇编进行编程。
该项目展示了在功能强大的CH32V003微控制器上实现令人惊讶的音频播放,该微控制器价格低廉(仅0.10美元),且仅具有16KB的闪存。 最初从简单的蜂鸣器生成开始,目标是让MCU“说话”。
直接存储音频需要大量的压缩。 测试表明,2位ADPCM压缩实现了最佳平衡,将6秒的音频片段(“打开舱门,HAL…”)压缩到12KB以下——可以舒适地与播放代码(1.4KB以下)一起存储。 虽然音质较低,但令人惊讶的是可以辨认出来。 创建了一个自定义工具,用于将WAV文件转换为这种格式。
除了压缩音频外,该项目还探索了使用Talkie库进行LPC语音合成,这是一种来自早期语音合成器(如德州仪器TMS5220)的技术。 这允许以极小的占用空间存储短语和单词,但声音听起来非常合成。 开发了一个AI辅助的网络应用程序,用于从语音录音生成LPC数据。
最终,该项目展示了巧妙压缩和高效算法的力量,从而能够在极其有限的硬件上实现语音和音频播放。 代码可在GitHub上获取。
## 技术领域的两大阵营与Postgres的复兴
技术世界经常分为两大阵营:追逐最新流行语(如流式湖仓和无服务器)的阵营,以及优先考虑常识的阵营。“流行语”阵营常常过度设计解决方案,受到简历构建和厂商炒作的驱动,而“常识”阵营则专注于简单性和第一性原理。 越来越多地,钟摆正在转向实用主义。
推动这种转变的两个趋势是:“小数据”运动——认识到强大且经济实惠的硬件通常可以消除对大型分布式系统的需求——以及“Postgres复兴”。 开发者们意识到Postgres可以处理令人惊讶的工作负载范围,通常可以用更简单的技术取代像Redis、MongoDB甚至Kafka这样的专用工具。
最近的基准测试表明,Postgres在发布/订阅消息传递和队列方面具有可扩展性,即使在单个节点上也能实现令人印象深刻的吞吐量。 尽管Kafka在某些发布/订阅场景中仍然更胜一筹,但作者认为过早优化是一种常见的陷阱。 专注于最小可行基础设施(MVI)——使用熟悉且足够好的技术——比在真正需要之前采用复杂的系统更有效。
最终,争论的重点不是Postgres *总是* 是最佳选择,而是它通常 *足够好*,可以为组织节省大量时间、成本和运营开销。 就像OpenAI所展示的那样,即使是快速扩张的公司,也可以在令人惊讶的简单数据库基础上蓬勃发展。
Grammarly 正在经历重大转变,在收购电子邮件客户端后将品牌重塑为“Superhuman”。 尽管公司名称已更改,但“Grammarly”产品将保留现有品牌。 此举标志着更广泛的雄心,即发展成为一个全面的生产力套件,与 Notion 和 Google Workspace 等平台竞争。
这项策略的核心是“Superhuman Go”,这是一款新的 AI 助手,集成到 Grammarly 扩展程序中。 它提供写作建议、电子邮件反馈,并与 Jira 和 Gmail 等应用程序连接,以提供上下文帮助——甚至可以自动化诸如日程安排和工单记录之类的任务。 未来计划包括与 CRM 和内部系统集成。
Grammarly 还在探索将其另一项收购 Coda 重新命名,并为 Superhuman Mail 和 Coda 文档套件添加 AI 功能。 新的订阅层级,定价为每月 12 美元(Pro)和每月 33 美元(Business),将提供扩展的语言支持和对 Superhuman Mail 的访问权限。