微软对其与 OpenAI 的财务关系保持着显著的不透明。据《华尔街日报》最近报道,微软因其对 OpenAI 的数十亿美元投资而产生的巨额亏损,被归入其最新年度报告中一个名为“其他,净额”的 47 亿美元的大类支出中。 关于该投资及其表现的细节通常含糊不清,几乎没有透明度来了解这一关键合作关系的财务影响。缺乏具体报告引发了人们对微软如何核算其在领先人工智能研究公司的重大股份的质疑。该报告强调了微软对其与 OpenAI 关系的详细披露的故意缺乏。
微软对其与 OpenAI 的财务关系保持着显著的不透明。据《华尔街日报》最近报道,微软因其对 OpenAI 的数十亿美元投资而产生的巨额亏损,被归入其最新年度报告中一个名为“其他,净额”的 47 亿美元的大类支出中。 关于该投资及其表现的细节通常含糊不清,几乎没有透明度来了解这一关键合作关系的财务影响。缺乏具体报告引发了人们对微软如何核算其在领先人工智能研究公司的重大股份的质疑。该报告强调了微软对其与 OpenAI 关系的详细披露的故意缺乏。
受Alex Petros关于基本HTML“咒语”的演讲启发,本文总结了可靠网络开发的关键代码片段。在创建基本的HTML文件时,四个标签对于一致的浏览器行为至关重要。
首先,`<!doctype html>` 确保浏览器以标准模式渲染,避免不可预测的怪癖。其次,`<html lang="en">` 声明文档的语言,有助于辅助技术、搜索引擎和本地化。
第三,`<meta charset="utf-8">` 正确显示各种字符——防止特殊字符、符号和表情符号出现问题。最后,`<meta name="viewport" content="width=device-width,initial-scale=1.0">` 对于响应式设计至关重要,确保在移动设备上正确缩放。
省略这些标签不一定会*破坏*代码,但可能导致渲染不一致和可访问性问题。包含它们可以确保更可预测和准确的网络体验。
## 光学压缩:一种潜在的AI效率提升 DeepSeek的最新研究强调了一个令人惊讶的发现:将文本表示为图像(“光学压缩”)比直接处理文本对AI模型来说效率可能更高。他们的研究表明,单个图像token可以准确地表示大约10个文本token,利用了图像嵌入的连续性,而文本token是离散的。 这对于降低成本和增加数据容量具有影响。类似于加速音频以降低转录成本,在将文本输入模型之前将其转换为图像,可以允许在推理过程中输入更多数据。诸如逐渐降低旧上下文的图像分辨率——模仿人类记忆——之类的策略也在被探索。 虽然目前这是一种小众技术,一些早期实现显示出希望,但其潜力是巨大的。它引发了一个问题,即未来的AI模型是否应该从根本上将文本视为一种图像数据,可能模仿人类处理信息的方式。在专门针对基于图像的文本训练模型方面仍然存在挑战,但光学压缩的概念为更高效和强大的AI系统提供了一条引人注目的途径。
## WorldGrow:无限3D世界生成 WorldGrow是一种新的生成方法,用于创建广阔、明确的3D世界,为传统世界模拟器提供替代方案。该方法由上海交通大学、华为和华中科技大学的研究人员开发,利用分层框架从单个种子生长环境。 该系统采用分块合成和粗到细的优化,生成具有详细局部几何和外观的连贯全局布局。重要的是,这些生成的世界被设计为可导航的,并且适合于测试导航和规划算法。 目前该项目为预印本(arXiv:2510.21682),展示了大规模环境的创建——包括一个19x39的室内世界(~1,800平方米),具有重建的网格和纹理渲染。代码正在积极开发中,并计划公开发布,包括预训练权重和完整的训练流程。
## GPUI 组件:一个基于 Rust 的桌面 UI 库
GPUI 组件是一个正在开发的跨平台 UI 库,用于使用 Rust 构建桌面应用程序,它利用 GPUI 渲染框架。它提供 60 多个受 macOS 和 Windows 美学启发的 UI 组件,并结合了现代 shadcn/ui 设计。
主要特性包括无状态、易于定制的组件,内置主题和尺寸选项(xs-lg),以及通过停靠布局系统实现灵活的布局。性能是优先考虑的,虚拟化表格和列表组件可用于处理大型数据集。它还支持 Markdown、HTML、图表,以及具有 LSP 功能和 Tree Sitter 语法高亮显示的高性能代码编辑器。
第一个使用 GPUI 组件构建的应用程序 Longbridge Pro 演示了多主题支持。目前通过 Git 依赖项访问 (`gpui = "0.2.2"`,`gpui-component = "0.3.0"`),该库是实验性的,存在一些限制,包括可选的 WebView 元素。示例和贡献指南可用,展示了它的潜力,以及与 Iced、egui 和 Qt 的比较。
## 计算机自由的缓慢消亡
数十年以来,个人电脑的核心自由在于运行任何你选择的软件的能力。从软盘到下载的演示程序,你的电脑由你控制。然而,这种自由正在迅速侵蚀,被伪装成必要的安全措施。
谷歌最近宣布对安卓应用安装施加更严格的限制,使得“侧载”——在Play商店之外安装应用——变得越来越困难。这延续了苹果公司以iPhone的封闭花园式方法为先导的趋势,优先考虑精选的应用生态系统,而非用户选择。
这并非新鲜事;游戏机早在几十年就率先推出了为盈利而锁定的系统。但将这种模式应用于通用计算机令人担忧。虽然安全性是一个有效的问题,但这些限制往往与公司控制和收入相一致。微软也曾尝试对Windows进行类似的锁定,但由于既定的用户期望而收效甚微。
损失的不仅仅是便利性;它扼杀了实验、创造力以及通过动手实践学习的能力。一个软件需要公司批准的未来,将限制创新,并将个人计算转变为被动消费。最终,支持开放平台并用你的钱包投票,对于维护你所拥有设备的控制权至关重要。
## GeoUtil:一套免费、私密且强大的地理空间工具 GeoUtil 是一套完全基于浏览器的地理数据处理工具集,提供专业级别的功能,无需注册或上传数据,从而确保完全的隐私。所有处理都在您的设备上本地进行,即时完成。 它支持多种格式,包括 GeoJSON、Shapefile、KML、CSV 等,并提供它们之间的**转换**工具。主要功能包括**距离和面积计算**、**方位角/航向查找**以及 **GeoJSON 统计分析**。 除了基本操作外,GeoUtil 还提供高级功能,例如 **坐标参考系统 (CRS) 转换**、**坐标格式转换**以及 **合并和分割**地理空间文件的工具。它还包括 **数据压缩器**,可以显著减小文件大小。 GeoUtil 非常适合 GIS 专业人员、Web 开发人员、数据分析师以及任何需要私密高效地处理地理数据的人。它为每个工具提供详细的文档和示例。它是一套功能强大、免费的资源,可用于各种地理空间任务。
## JPEG XL:超越位深,实现卓越图像质量 JPEG XL 与 AVIF 等其他现代图像格式的不同之处在于一项激进的设计选择:它*忽略*位深。传统编码器通常关注 8 位、10 位或 12 位精度,而 JPEG XL 内部将所有图像数据转换为浮点数,将颜色表示为分数而不是固定的整数值。 这并非一种限制,而是一种优势。人眼感知的是平滑度,而不是渐变中的步数。通过在连续的浮点空间中工作,JPEG XL 优化了*感知*保真度——图像的*外观*——而不是数值精度。 AVIF 基于视频编码器架构,仍然依赖于基于整数的编码,需要针对不同的位深采用不同的优化策略。相反,JPEG XL 使用感知锚点(强度目标)和独特的色彩空间(XYB)来智能地分配精度,使其在最重要的地方发挥作用,并能无缝适应不同的显示器和内容。 这种方法简化了工作流程,确保了跨内容类型的一致质量,并为图像在显示技术不断发展的情况下做好准备。最终,JPEG XL 优先考虑的是保留*观看*的体验,而不仅仅是数字数据,使其成为真正具有前瞻性的图像格式。
意大利本土与西西里之间的火车旅程包含一段独特的海峡渡轮,穿越墨西拿海峡,在乘客之间营造出一种令人惊讶的社群感。 这段简短的20分钟海上航行鼓励人们交谈——关于生活、政治和旅行,并伴随着珍爱的仪式,例如光顾炸饭团柜台,那里的形状变化(卡塔尼亚是尖的,巴勒莫是圆的)反映了当地的自豪感。 对于许多西西里人来说,在墨西拿港看到圣母雕像标志着“家”的欢迎。高效的转运过程,将车厢连接到渡轮,然后再连接到西西里铁路,是一项顺利的操作。 沿着西西里东海岸的火车旅程提供了令人惊叹的景色——柠檬园、埃特纳火山的景色以及节日的装饰——完成了从米兰到锡拉库萨的20小时旅程,提供了一种真正身临其境的旅行体验。
此文档似乎是PDF文件的内部结构,特别是其交叉引用表(xref)和流数据。**这不是人类可读的内容**,例如文本或图像。 `xref`表对于PDF阅读器定位文件中的不同对象至关重要——例如文本、图像、字体和元数据。数字(例如“134 42”)表示起始和结束对象编号。 随后的“00000 n”行指向文件中每个对象开始的字节偏移量。 `stream`部分(由`stream`和`endstream`指示)包含压缩数据,可能代表一个或多个对象的实际内容。 流中的字符是二进制的,在没有适当解码的情况下没有意义。 本质上,这是PDF的“后台”,详细说明了内容*如何*组织,而不是内容*是什么*。 没有PDF阅读器,它只是一系列数字和无法解释的字符。