``` ```
``` ```
请启用 JavaScript 和 Cookie 以继续。
美国企业界正面临一场“代币最大化”(tokenmaxxing)危机,公司将人工智能的使用指标与实际生产力混为一谈。一份近期报告显示,某未具名的企业客户因缺乏使用限额,单月产生了高达 5 亿美元的 Claude 使用账单。虽然该客户身份未公开,但外界猜测指向了亚马逊;该公司近期关闭了一个内部排行榜,该榜单曾鼓励员工通过人工智能代理完成不必要的任务,以虚增使用评分。
这一现象体现了古德哈特定律的危险应用:当一个指标成为目标时,它就不再是一个有效的衡量标准。包括 Meta、Uber 和微软在内的科技行业各公司,都在报告类似的“人工智能宿醉”现象,即代币消耗量远超实际产出。该行业正日益被循环经济流所驱动:超大规模云服务商投资人工智能公司,而后者又将这些资金投入云基础设施,与此同时,管理层推行的“人工智能采用率”配额激励着员工进行“指标表演”。归根结底,当前的企业人工智能热潮存在建立在人为需求之上的风险,即以过度的代币消耗误作为进步,从而掩盖了其缺乏真正经济价值的本质。
针对安德鲁·罗斯·索尔金(Andrew Ross Sorkin)关于市场必然崩盘的警告,QTR 的《边缘金融》(Fringe Finance)指出,这场清算危机的具体表现已经显现。作者列举了四个关键预警信号:顽固的通胀、估值过高的市场、债台高筑的消费者以及压力重重的债券市场,这些因素使得美联储几乎已无良策。
作者认为美国面临两条路径:要么是通过混乱的金融危机实现“硬违约”,要么是通过失控的通胀实现“软违约”。虽然硬违约会带来突如其来的毁灭性打击,但作者坚信政策制定者几乎肯定会选择后者,以避免立即崩溃。
这种“软违约”将表现为一种“向上崩盘”,即名义资产价格(股票、房地产和黄金)上涨,而美元的实际购买力却在被侵蚀。在这种情境下,政府通过以贬值的货币偿还债务来避免正式违约。因此,作者警告称,尽管金融市场可能看起来具有韧性,但为了避免无序的清算,基础经济稳定性正在被牺牲,这使得黄金等硬资产成为长期的必备考量。
Step 3.7 Flash 是一款智能体基础模型,它利用测试时缩放(test-time scaling)而非单纯依赖参数规模来实现高水平的视觉性能。通过调用专用工具,该模型弥补了其体积较小的劣势,能够媲美规模大其五倍的模型性能。 主要功能包括: * **视觉搜索:** 通过集成外部搜索能力增强识别效果,其性能可与规模大得多的模型相媲美。 * **Python 集成:** 提供统一的代码接口(缩放、裁剪、像素级处理),以处理复杂的、高分辨率的推理任务。 * **图形用户界面(GUI)操作:** 实现对智能手机应用程序稳健的长程控制,在 Android Daily 基准测试中表现优于规模更大的模型。 该模型的一项重大突破是其**涌现出的组合泛化能力**。Step 3.7 Flash 能够自主结合视觉和非视觉工具(例如先编写代码,然后使用图形界面来验证其输出),而无需明确的训练。这种跨领域迭代和自我修正的能力,标志着智能体推理的一大进步,使模型能够执行超越标准文本交互的复杂现实任务。
ATLAS 是一个使用 Lean 4 语言编写的大规模自动形式化数学库。该项目由“AutoformBot”流水线生成,涵盖了代数、分析、几何和理论计算机科学等多个学科,翻译了 26 本本科及研究生水平教科书中的定义、陈述和证明。
作为一项持续的研究工作,ATLAS 提供了一个可重用的形式化构建块存储库,旨在加速人类和机器驱动的形式化进程。目前的库包含超过 63 万行代码,拥有 46,203 个声明,自动证明成功率达 92.7%。
用户可以通过在线可视化工具访问该库,进行浏览、对比非形式化教科书陈述与 Lean 对应项,并检查逻辑依赖关系。每个书籍目录都包含源文件、目标陈述以及针对准确性和代码质量的自动评估指标。由 Ahmad Rammal 等人领导的 ATLAS 团队正持续扩展该语料库,提升可维护性,并使代码与标准的 Mathlib 规范保持一致。他们欢迎外部贡献,以帮助扩展和完善这一日益增长的形式化数学知识集合。
Robinhood 正进军 AI 智能体领域,推出多项新功能,允许用户授权 AI 智能体代其进行股票交易和支付。
在本次 Beta 测试版中,用户可以为自己的智能体创建专用账户和钱包,智能体可利用预存资金分析投资组合并执行交易。为确保安全,Robinhood 提供了实时通知、交易预览及确认机制,以及欺诈检测功能。通过其模型上下文协议(MCP)服务,智能体能够执行复杂任务,例如分析行业风险敞口和查看分析师报告。
此外,Robinhood 还专门为 AI 智能体推出了虚拟信用卡,目前仅向 Gold Card 持卡人开放。该功能允许智能体在设定的月度消费限额及可选的交易审批要求下进行支付。
虽然目前该平台仅支持股票的自动化交易,但 Robinhood 计划将支持范围扩大至期权、加密货币、期货及预测市场。此举顺应了行业大趋势,使 Robinhood 与 Stripe、Google 等公司一道,共同为 AI 自主商务提供基础设施。
这篇摘自杰西卡·里斯金(Jessica Riskin)即将出版的新书《生命的力量》(*The Power of Life*)的文章,引人入胜地介绍了让-巴蒂斯特·拉马克(1744–1829)。拉马克不仅是以进化论先驱的身份为人所熟知,他在早期气象学领域也是一位重要人物。 拉马克的科学方法以其对参与式、易普及研究的执着而著称。他是第一位对云层进行分类的人,并设想建立一个由“自然之友”组成的公共网络,通过记录大气观测数据,帮助揭示月球对天气的复杂周期性影响。与将宇宙视为僵化、决定论机器的同代人皮埃尔-西蒙·拉普拉斯不同,拉马克拥抱不确定性以及自然界那“翻腾的骚动”。 拉马克在气象学上的雄心最终与拿破仑统治下法国的政治气候发生了冲突。他倡导去中心化的科学共同体,并拒绝接受拉普拉斯的决定论,这些主张被视为具有颠覆性。结果,他受国家资助的气象局被拆除,他本人最终也遭到了拿破仑的压制。里斯金的这部传记挑战了英语世界对拉马克的忽视,认为他这种极具人性、诗意且重关联的科学方法,在思想史上是一段至关重要却被低估的传统。
巴黎 AI Now 峰会展示了 Mistral AI 从模型提供商向全栈企业合作伙伴的转型。Mistral 并未盲目追求通用人工智能(AGI),而是专注于通过效率、主权和本地化部署等战略,为欧洲企业提供立竿见影的投资回报。
主要内容包括:
* **全栈生态系统:** Mistral 正在构建自己的计算基础设施,同时提供平台和咨询服务,以支持大规模的企业部署。
* **专用模型:** 他们的策略侧重于小型、高效的模型(如用于工业机器人和语音领域),在速度和能耗方面优于通用模型。
* **主权:** 通过支持本地化部署,Mistral 为银行业等受监管的行业提供了重要的替代方案,使企业能够在不损害数据隐私的情况下利用人工智能。
* **智能体框架:** 公司强调,模型需要“配套工具”(提供上下文和持久性的工具),才能从单纯的计算能力转化为实际的业务应用。
最终,Mistral 将自己定位为欧洲的主要 AI 合作伙伴,提供了一种务实且具有主权的替代方案,以应对美国科技巨头的竞争。尽管峰会缺乏突破性的模型发布,但他们对实际工业效用和欧洲自主权的关注,使其成为全球 AI 领域的重要参与者。
尽管有关金砖国家替代方案和各国央行购买黄金会导致“美元消亡”的说法甚嚣尘上,但兰斯·罗伯茨(Lance Roberts)认为,美元依然是全球金融体系的基石。
数据显示,外国对美国国债的需求正处于历史高位,若计入离岸工具,外国持仓总额已达约11万亿美元。各国央行增加黄金储备并非意味着放弃美元,反而巩固了美元的霸权地位,因为黄金的定价、基准设定和交易均以美元计价。
此外,美国正在战略性地扩大其影响力。财政部长斯科特·贝森特(Scott Bessent)正通过“胡萝卜加大棒”的政策(例如货币互换额度和制裁)将阿联酋等地区强国纳入美元轨道,从而有效地预先阻断了非美元替代方案的出现。与此同时,挂钩美元的稳定币的兴起,正将美元的影响力延伸至新兴零售市场。
归根结底,罗伯茨主张,那些赌注美元崩溃的人误将多元化当成了抛弃。美元并未消亡,而是正通过新的数字基础设施和激进的货币政策进行演变,以确保其在可预见的未来仍是全球经济的主要定价基础。对于投资者而言,建议增持美国资产,而非对其进行对冲。
高乐氏(Clorox)股价在董事长兼首席执行官琳达·伦德尔(Linda Rendle)因“健康原因”突然宣布离职后出现下跌。伦德尔已在公司工作超过20年,她将以顾问身份留任,协助领导层过渡。
伦德尔的离职正值公司处境艰难之际。在她担任CEO的六年里,高乐氏股价累计下跌了57%。华尔街分析师对公司的发展前景持怀疑态度,指出其存在持续的执行问题、现代化转型失败以及品类增长缓慢等短板。TD Cowen和法国巴黎银行(BNP Paribas)等机构的分析师强调,继任CEO将面临严峻的环境,包括可能下调的盈利指引以及持续的运营波动。
尽管公司官方将此次离职归因于健康问题,但这一时机引发了市场猜测,认为投资者对公司缓慢的转型表现日益不满,这可能也是导致其离职的原因之一。
关于 新闻 版权 联系我们 创作者 广告 开发者 条款 隐私 政策与安全 YouTube 的运作方式 测试新功能 © 2026 Google LLC
尽管现代人工智能可以轻松解决传统的验证码(CAPTCHA),但其解决问题的过程与人类存在显著差异。我们的研究表明,即使人工智能和人类能达到相同的任务结果,它们在行为模式(如点击顺序和决策风格)上也表现出统计学上的显著差异。
为解决这一问题,我们引入了“过程图灵测试”(Process Turing Test)。该测试超越了传统的基于结果的评估,旨在评估智能体的内部解决问题过程是否模拟了人类的认知心理。我们使用包含 30 项认知任务的“CogCAPTCHA30”测试集进行了验证。结果显示,当前的前沿模型(如 GPT、Claude、Gemini)并不会随着规模的扩大而变得更像人类;事实上,专门针对人类认知数据训练的小型模型在模拟人类处理特征方面表现更佳。
我们发现,虽然可以通过微调智能体来缩小“过程差距”,但在任务泛化或智能体无法完全获知判别器标准的情况下,这种能力会失效。归根结底,过程图灵测试作为一种稳健且可扩展的人类验证方法,凸显了人工智能在能力不断提升的同时,其运作机制与人类认知依然存在根本性的区别。
Antares已与Urenco签署了首份高丰度低浓缩铀(HALEU)长期商业合同,确保从该公司即将投产的英国设施获得燃料供应。这项定于2031年执行的里程碑式交易,标志着开发商正从单纯依赖有限的政府储备转向建立私营供应链。
尽管Antares是行业领先的开发商,且近期入选了美国空军的核能项目,但其选择国际采购燃料的决定,凸显了对美国本土浓缩产能扩张缓慢的不满。尽管联邦政府对Centrus和General Matter等本土公司投入了大量资金,但商业规模的西方生产能力仍是先进反应堆产业的主要瓶颈。
对于微型反应堆领域而言,HALEU的供应能力仍是制约增长的首要因素。虽然Urenco与Antares的协议并未解决当前的燃料短缺问题,但它是一个重要的里程碑,标志着行业终于从投机性的公告转向了实质性的商业承诺。
开源工具 Kaneo 的创建者 Andrej Acevski 最近发现,有诈骗者利用他的云平台发送了 14,520 封网络钓鱼邮件。攻击者利用该平台的开放注册和邀请系统,以他已验证的域名为名义,发送了伪装成银行信息的欺诈邮件。 此次事件并非技术漏洞,而是对软件既有功能的滥用。Acevski 意识到,他无意中将自己域名的声誉和邮件发送权限借给了不法分子。尽管他开发的自托管软件旨在实现个人控制,但他认识到,其托管的云版本已成为需要更严格安全监管的关键基础设施。 为了防止此类滥用,Acevski 实施了验证码(CAPTCHA)、临时邮箱拦截器、速率限制以及针对新账号的邀请权限限制等防护措施。他总结认为,开发者必须区分开源软件和多租户 SaaS 模式下的威胁模型。管理云服务不仅仅是托管代码,更肩负着保护平台完整性和维护发送域名声誉的专业责任。
在《发展心理学前沿》(*Frontiers in Developmental Psychology*)最近的一篇社论中,临床心理学家莫妮卡·内夫·林德(Monika Neff Lind)博士对全球范围内禁止16岁以下青少年使用社交媒体的趋势提出了质疑。支持者认为这些禁令有助于改善心理健康,但内夫·林德博士断言,目前尚无严谨的科学证据支持这一观点。
她的研究团队回顾了现有的关于社交媒体限制的实验,发现没有任何研究涉及16岁以下的参与者。此外,关于成年人的研究结果也不一致,许多研究显示其对福祉的影响微乎其微,甚至有负面影响。
内夫·林德博士警告称,此类禁令可能会适得其反,引发青少年的逆反心理,通过侵入性的年龄验证技术侵犯隐私,并切断青少年获取必要组织沟通渠道的途径。由于许多年轻人可能会绕过这些限制,禁令最终消除的可能并非社交平台本身,而是家长提供的保护性监管。
内夫·林德博士敦促各国政府在缺乏数据的情况下,不要急于推行政策,而应针对这些禁令的实际影响进行全面且协作的评估。她认为,决策者正面临“盲目行动并造成破坏”的风险,并建议改善数字环境——而非简单粗暴地禁止——才是应对青少年心理健康危机的更有效途径。
Rockstar Games 的员工已正式成立“Rockstar 游戏工会”(Rockstar Game Workers Union),并加入英国独立工人工会(IWGB)。此前,该公司去年曾裁掉 30 多名员工,引发巨大争议;工会声称这是针对工会的打压行为,而非员工存在不当行为。
该工会现已对 Rockstar 发起正式法律诉讼,目前正等待开庭。据组织者表示,这些惩罚性措施反而成为了团结的催化剂,促使 Rockstar 在爱丁堡、伦敦、利兹、林肯和邓迪等地的英国办公室员工联合起来。
工会旨在解决关键的职场问题,具体诉求包括:提高薪资透明度、推行灵活办公制度,以及终结游戏行业普遍存在的“加班文化”(crunch)。在此背景下,由于有指控称 Rockstar 曾试图阻碍法律诉讼进程,该运动势头愈发强劲。目前,工会已建立各类社交媒体渠道及捐款页面,以支持其为改善劳动条件而进行的持续斗争。
“互联网死亡”理论认为机器人已占据在线内容的主导地位,而如今,这一理论正被更为危险的“经济死亡”理论所取代。数万亿美元对人工智能的大规模投资,其目的绝非仅仅为了“更好的自动补全”,而是一场旨在取代整个专业阶层劳动力的系统性努力。
这种对“过度自动化”的追求,其动力源于季度股价的激励,而非真正的生产力提升。通过优先考虑消除劳动力,人工智能公司正在系统性地摧毁自身的消费者基础——这陷入了一种自毁式的“裁员陷阱”,即企业在获取成本节省的同时,将由此产生的经济萎缩转嫁给整个社会。
这种转型对民主治理构成了生存威胁,因为民主治理依赖于一种“契约”:当权者需要被治理者的劳动、税收和消费。人工智能正威胁着切断这一联系,将财富集中在少数精英利益相关者手中,同时侵蚀社会契约。尽管充斥着关于“丰饶”和“长期主义”的乌托邦式修辞,但当前的发展特点却是智识上的肤浅,以及为了一个假设的未来而牺牲现存生命这一道德上的失败。归根结底,该行业正在构建一个人类能动性变得多余的世界,而推动这一切的领袖们,将资本积累置于被他们所取代的民众的物质现实之上。
在俄罗斯针对邻国乌克兰的夜间袭击中,一架俄罗斯无人机击中了罗马尼亚加拉茨的一栋十层公寓楼。爆炸和火灾导致两人受伤,并迫使70名居民撤离。尽管此前曾有无人机碎片落入罗马尼亚境内,但这是此类入侵首次造成人员伤亡。
罗马尼亚外交部谴责此次袭击是“严重且不负责任的升级”,并已正式要求北约加快在该国部署反无人机防御系统。北约发言人重申了联盟加强防御以应对此类威胁的承诺。
克里姆林宫否认对此次袭击负责,俄罗斯官方媒体暗示该无人机可能来自乌克兰军队。此次事件进一步加剧了俄罗斯与北约之间的紧张关系,其背景是持续不断的边境担忧以及东欧地区日益增加的军事部署。虽然罗马尼亚军方指出在人口稠密地区拦截无人机难度较大,但该事件突显了随着俄罗斯对乌克兰频繁的空中打击持续进行,北约盟国所面临的风险正在上升。
彭博 (Bloomberg) 需要帮助?请联系我们 我们检测到您的计算机网络存在异常活动 如需继续,请点击下方方框以证明您不是机器人。 为什么会出现这种情况? 请确保您的浏览器已启用 JavaScript 和 Cookie,且未拦截其加载。 如需了解更多信息,请查阅我们的服务条款和 Cookie 政策。 需要帮助? 如有关于此消息的疑问,请联系我们的支持团队并提供下方的参考 ID。 屏蔽参考 ID:50731d51-5b78-11f1-8358-41cdd09fe775 订阅 Bloomberg.com,随时随地掌握最重要的全球市场新闻。 立即订阅
请启用 JavaScript 和 Cookie 以继续。
法拉利即将推出的电动豪华旅行车 Luce 因其非传统的设计和 64 万美元的惊人价格引发了争议。尽管它在高性能电动汽车领域与售价 9.5 万美元的特斯拉 Model S Plaid 形成了竞争,但这两款车身处完全不同的市场:特斯拉提供的是可负担的大规模量产动力,而法拉利则优先考虑排他性和超豪华地位。
从技术指标上看,两车旗鼓相当。Luce 在原始输出功率上略胜一筹(1050 马力对 1020 马力),并配备了先进的四电机扭矩矢量控制系统。然而,Model S Plaid 在直线加速方面仍占据优势,零百加速时间不到两秒,且拥有更高的极速和更优的续航能力。虽然法拉利采用了容量更大的 122 kWh 电池并具备更快的 800 伏充电能力,但特斯拉在软件成熟度和整体能效方面依然保持领先。
归根结底,由乔尼·艾维(Jony Ive)和马克·纽森(Marc Newson)参与设计的 Luce,标志着法拉利向电动化时代的果敢转型。尽管特斯拉仍是高性能电动汽车的标杆,但法拉利正将 Luce 定位为与劳斯莱斯等超豪华标志性品牌竞争的产品,这证明了即使在电气化时代,品牌声望依然是强大的差异化因素。
请启用 JavaScript 和 Cookie 以继续。
在线治疗平台 Headway 已宣布,所有客户和提供者必须进行强制性的身份验证。用户需要扫描政府签发的带照片身份证件,并进行实时生物识别面部扫描,其中包括在设备摄像头前转动头部。 该公司表示,这些措施旨在确保平台安全并核实用户身份。Headway 坚称,所采集的面部图像将仅用于验证目的。值得注意的是,该平台声明此流程无法选择退出;不愿配合的用户必须完全离开该平台。
在为即将高中毕业的侄子挑选笔记本电脑时,作者对比了两个选项:苹果 MacBook Neo(学生价 499 美元)和 Framework 12(749–799 美元)。
尽管 Framework 以可维修、可升级以及多功能的 360° 触控屏为卖点,但其综合性价比并不理想。基准测试显示,MacBook Neo 运行速度更快、能效显著更高、完全静音,且拥有更出色的屏幕素质和做工品质。虽然 Framework 提供了模块化接口和特殊的实用性,但其屏幕表现平平、扬声器音质欠佳,且性能存在局限性,很难支撑其高出 20%–40% 的价格。
最终,作者的侄子选择了 MacBook Neo,作者对此决定表示认可。虽然 Framework 12 是一款性能不错的设备,但在苹果的规模经济优势面前显得竞争力不足。作者总结认为,MacBook Neo 目前为“价廉物美”类产品树立了新标准,对于大多数学生来说,它是更合理的选择。
**Bijou64** 是一种为 Subduction CRDT 同步协议开发的新型可变长度整数(varint)编码。它最初是为了解决非规范字节表示可能导致签名验证攻击的安全问题而设计的,但出乎意料的是,其实际性能比行业标准的 LEB128 快得多。
与允许同一数字有多种表示方式(需要昂贵的运行时验证来确保规范性)的 LEB128 不同,Bijou64 在结构上是规范的。它采用“首字节作为标签”的技术来确定整数长度,使解码器能够立即分配内存(O(1)),而无需像 LEB128 那样扫描延续位(O(n))。
通过放弃位掩码和位移操作,转而使用连续的大端序负载,Bijou64 充分发挥了现代 CPU 分支预测和字节交换指令的优势。基准测试显示,其解码速度比 LEB128 快 2 到 10 倍,同时保持了几乎相同的压缩尺寸。
虽然 LEB128 依然是稳定且久经考验的标准,但对于需要严格字节级规范性的协议(如涉及数字签名或内容寻址的场景),Bijou64 提供了一种结构更安全、性能更高的替代方案。该实现已在 crates.io 上发布,其规范和设计重点在于从构建层面防止常见的安全漏洞。
“Linux 桌面之年”的梦想正在破灭,这并非由于软件质量问题,而是因为“用户”的定义已从人类转向了人工智能体。
人工智能体若要高效运作,必须依赖辅助功能 API——即最初为屏幕阅读器构建的底层“树状”结构。苹果在该领域的统治地位源于数十年来对严格设计标准的执行,开发者需默认遵守 SDK 中的相关规范。因此,macOS 为人工智能体提供了一个可靠且高保真的运行环境。
Windows 虽然拥有强大的 API,但其支离破碎的旧版软件历史造成了“考古学”式的困境,阻碍了人工智能体进行一致的交互。与此同时,Linux 虽然具备所需的组件,却缺乏强制执行跨平台统一性的中央权威。
辅助功能曾被视为一种小众的道德义务,如今已成为人工智能不可或缺的基础设施。尽管 Linux 开发者能够构建复杂的工具,但他们缺乏使整个生态系统实现“兼容代理”所需的自上而下的统一治理。随着桌面可用性的标准从“方便人类”转向“人工智能互操作性”,Mac 根深蒂固的架构一致性使其成为了未来代理驱动型计算的天然归宿。
开启路径
我将从科技行业退休,回归离线生活
作者:Chad Whitacre ❧ 发布于 2026 年 5 月 28 日
简而言之:人工智能彻底耗尽了我对开源事业的最后一点热情。祝大家一切顺利!
披露/广告:我效力于 Sentry。
© Chad Whitacre ❧ 首页
弗吉尼亚州联邦法官利奥妮·M·布林克马(Leonie M. Brinkema)已暂时叫停了特朗普政府总额18亿美元的“反武器化基金”。这项禁令禁止政府在法律诉讼期间转移资金、处理索赔或发放款项。
该基金是特朗普及其家人相关和解协议的一部分,旨在补偿那些声称遭受“政治动机起诉”的人,包括特朗普近期赦免的1500名国会山骚乱被告。民主党议员对此举表示强烈反对,称其为总统政治盟友的“行贿基金”。
布林克马法官颁布此项禁令,旨在防止在法院全面审查案件前,纳税人的资金被不可逆转地发放。法院定于6月12日举行听证会,以决定是否延长该禁令。与此同时,加利福尼亚州州长加文·纽森(Gavin Newsom)宣布,计划对任何从该基金获得补偿的加州居民征收100%的税款。
请启用 JavaScript 和 Cookie 以继续。