这个演示展示了高性能数值计算库 JAX 的强大功能,通过仅用 100 行 Python 代码构建一个简单的 3D 图形渲染器——该渲染器可以直接在浏览器中通过 WebGL 运行。核心技术利用**符号距离函数 (SDF)** 来表示形状,提供诸如可组合性和易于碰撞检测等优势。 与传统的多边形渲染不同,这段代码将对象定义为距离,从而实现平滑混合和数学运算。JAX 的关键优势在于通过**向量化**(使用 `vmap`)并行处理所有像素,以及通过**自动微分** (`jax.grad`) 有效地计算表面法线。 作者强调了 JAX 几乎可以纯粹作为数学函数来表达图形算法的能力,从而减少了样板代码,并为该过程带来了“机械同理心”。这展示了 JAX 在创建简洁高效的图形应用程序方面的潜力。
## 大语言模型时代的数据科学家“反击”
尽管大型语言模型(LLM)兴起,并引发了对数据科学家技能过时的担忧,但数据科学的核心技能实际上比以往任何时候都*更*重要,而非更不重要。虽然LLM简化了AI的*部署*,但它们并不能消除对严格测试、调试以及理解AI在现实世界中表现的需求。
最初的炒作集中在模型*创建*上,这现在主要由基础模型API处理。然而,大部分工作在于确保这些模型能够很好地泛化,识别失败点,并建立有意义的指标——所有这些都是传统的数据科学领域。
常见的陷阱包括依赖于通用且未经验证的指标、设计糟糕的实验(使用不具代表性的数据)、存在缺陷的数据/标签以及过度自动化。数据科学家的方法强调**关注数据**:进行探索性数据分析,验证判断者(如分类器),并将合成测试建立在现实世界的观察之上。
最终,工作内容并没有改变——它只是发生了转移。数据探索、实验设计和批判性评估方面的技能对于有效利用LLM的力量至关重要。Python仍然是关键工具,而关注数据驱动的洞察是成功的关键。