## Olmo 3:一个完全开放和可追溯的语言模型家族 AI2 发布了 Olmo 3,一个开源语言模型家族(7B 和 32B 参数),旨在通过完全透明来推进开放式人工智能研究。与仅仅发布模型权重不同,Olmo 3 提供了对*整个*模型开发流程的访问权限——包括数据集、代码、检查点和训练过程——从而实现定制化和更深入的理解。 该家族包括 Olmo 3-Base(最强大的完全开放基础模型)、Olmo 3-Think(领先的开放推理模型,具有可追溯的推理步骤)、Olmo 3-Instruct(具有竞争力的聊天/工具使用模型)和 Olmo 3-RL Zero(用于强化学习研究)。Olmo 3-Think (32B) 显著缩小了与更大、闭源模型之间的性能差距,同时使用了明显更少的训练数据。 主要特性包括增强的数据策展(Dolma 3 和 Dolci 数据集)、高效的训练堆栈以及与 OlmoTrace 的集成——一种将模型输出追溯到训练数据的工具。这允许研究人员检查模型表现出某种行为的*原因*,并在开发的任何阶段进行干预。所有组件均以宽松的开源许可发布,从而促进协作和负责任的人工智能发展。
2025年11月11日。2011年丹尼斯·里奇去世后,我曾想过是否应该在Unix系统中将用户名退役,以示尊敬,就像体育队退役伟大球员的号码一样。当时我曾向useradd.c提交过一个补丁,但被拒绝了;我想这可以理解,但我自己在我的机器上运行了修改后的版本一段时间,但没有效果,只是出于我自己的原因。那些几行代码可能运行了十几遍,检查着服务帐户的名字,这些帐户不会反对,但我知道它们在那里。我经常想知道将更深厚的文化历史融入到常用代码库的功能中会是什么样子,以及共同的遗产可能意味着什么,并且可能随着时间的推移获得什么。历史可能会无形地积累,不是在承重错误或临时永久性中,而是在人类历史的基准点中。你现在不能在NHL穿99号球衣,也不能在NBA穿6号球衣。也许你不应该能够以dmr的身份登录,原因相同。
## 希尔伯特空间:将线性代数扩展到函数
希尔伯特空间将线性代数的力量扩展到传统向量之外,包括函数。其核心思想是将函数视为无限维向量——函数的“元素”是其在连续输入范围内的值,类似于有限向量的组成部分。
函数与标准的加法和标量乘法结合,形成一个向量空间。为了能够进行更复杂的操作,我们关注*平方可积函数*——其平方幅度的积分是有限的函数。这允许定义一个*内积*(推广向量点积)和一个*范数*(测量函数“长度”)。
至关重要的是,平方可积函数的空间是*完备的*,这意味着它包含其所有的极限点。这种完备性,以及内积,定义了一个**希尔伯特空间**,解锁了诸如傅里叶级数(将函数分解为更简单的组成部分)之类的工具,并为量子力学提供了一个数学基础,其中粒子状态表示为希尔伯特空间内的波函数。
本质上,希尔伯特空间提供了一个严格的框架,用于应用线性代数技术来分析和操作函数,从而弥合抽象数学概念与现实世界应用之间的差距。