MemeData

微软将OpenAI的亏损计入47亿美元“其他”费用。 Microsoft's folds losses from OpenAI into $4.7B expense line – "other" 35 天前

微软对其与 OpenAI 的财务关系保持着显著的不透明。据《华尔街日报》最近报道，微软因其对 OpenAI 的数十亿美元投资而产生的巨额亏损，被归入其最新年度报告中一个名为“其他，净额”的 47 亿美元的大类支出中。关于该投资及其表现的细节通常含糊不清，几乎没有透明度来了解这一关键合作关系的财务影响。缺乏具体报告引发了人们对微软如何核算其在领先人工智能研究公司的重大股份的质疑。该报告强调了微软对其与 OpenAI 关系的详细披露的故意缺乏。

不要忘记这些标签，以使HTML按你的预期工作。 Tags to make HTML work like you expect 35 天前

受Alex Petros关于基本HTML“咒语”的演讲启发，本文总结了可靠网络开发的关键代码片段。在创建基本的HTML文件时，四个标签对于一致的浏览器行为至关重要。首先，`<!doctype html>` 确保浏览器以标准模式渲染，避免不可预测的怪癖。其次，`<html lang="en">` 声明文档的语言，有助于辅助技术、搜索引擎和本地化。第三，`<meta charset="utf-8">` 正确显示各种字符——防止特殊字符、符号和表情符号出现问题。最后，`<meta name="viewport" content="width=device-width,initial-scale=1.0">` 对于响应式设计至关重要，确保在移动设备上正确缩放。省略这些标签不一定会*破坏*代码，但可能导致渲染不一致和可访问性问题。包含它们可以确保更可预测和准确的网络体验。

大型语言模型是否应该将文本内容直接当作图像来处理？ Should LLMs just treat text content as an image? 35 天前

## 光学压缩：一种潜在的AI效率提升 DeepSeek的最新研究强调了一个令人惊讶的发现：将文本表示为图像（“光学压缩”）比直接处理文本对AI模型来说效率可能更高。他们的研究表明，单个图像token可以准确地表示大约10个文本token，利用了图像嵌入的连续性，而文本token是离散的。这对于降低成本和增加数据容量具有影响。类似于加速音频以降低转录成本，在将文本输入模型之前将其转换为图像，可以允许在推理过程中输入更多数据。诸如逐渐降低旧上下文的图像分辨率——模仿人类记忆——之类的策略也在被探索。虽然目前这是一种小众技术，一些早期实现显示出希望，但其潜力是巨大的。它引发了一个问题，即未来的AI模型是否应该从根本上将文本视为一种图像数据，可能模仿人类处理信息的方式。在专门针对基于图像的文本训练模型方面仍然存在挑战，但光学压缩的概念为更高效和强大的AI系统提供了一条引人注目的途径。

## LLM 与图像处理：总结最近Hacker News上的一场讨论探讨了将文本视为图像以供大型语言模型（LLM）处理的想法。核心问题是，绕过传统的文本分词，直接将文本作为视觉数据处理是否有利。虽然过去将数据转换为图像用于机器学习的尝试常常失败，但支持者认为图像具有优势：它们能够捕捉基本文本编码遗失的细微差别（如格式、字母形状），并利用连续的token而非离散的token。然而，批评者指出，这些优势并不*需要*图像转换步骤，仅仅突出了当前分词方法的局限性。例如，将音乐转换为频谱图进行AI生成，以及DeepMind的DeepVariant（基因组数据转换为图像）都取得了成功，但这些是特定案例。争论的中心在于，图像处理增加的复杂性是否超过潜在收益，特别是考虑到文本token中固有的上下文和嵌入信息。最终，这场讨论凸显了人们对更高效和信息丰富的LLM数据表示方法的持续探索，并质疑未来是否在于视觉处理或改进的文本编码技术。

世界生长：生成无限3D世界 WorldGrow: Generating Infinite 3D World 35 天前

## WorldGrow：无限3D世界生成 WorldGrow是一种新的生成方法，用于创建广阔、明确的3D世界，为传统世界模拟器提供替代方案。该方法由上海交通大学、华为和华中科技大学的研究人员开发，利用分层框架从单个种子生长环境。该系统采用分块合成和粗到细的优化，生成具有详细局部几何和外观的连贯全局布局。重要的是，这些生成的世界被设计为可导航的，并且适合于测试导航和规划算法。目前该项目为预印本（arXiv:2510.21682），展示了大规模环境的创建——包括一个19x39的室内世界（~1,800平方米），具有重建的网格和纹理渲染。代码正在积极开发中，并计划公开发布，包括预训练权重和完整的训练流程。

## WorldGrow：无限3D世界生成 - 摘要 WorldGrow是一个新的框架，旨在利用人工智能生成无限延伸、连贯的3D世界。该项目在Hacker News上分享，利用预训练的3D模型和分层场景合成方法，专注于生成逼真且结构一致的环境。讨论的中心在于，这种方法是否比现有的程序化生成技术（如波函数坍塌（WFC）——一些人认为它具有类似目的）或传统PCG方法（在游戏中使用了数十年）具有显著优势。人们对生成空间的“趣味性”表示担忧，许多人指出，创造*引人入胜*的虚拟环境才是真正的挑战，而不仅仅是大型环境。一些评论员指出Minecraft、No Man’s Sky和Dwarf Fortress等游戏是成功的大世界生成的例子，而另一些人则强调了潜在的应用，例如训练人工智能机器人或为恐怖游戏（如Backrooms）创建环境。一个关键问题围绕资源消耗和控制——人工智能驱动的生成是否比成熟的技术提供优势，或者引入了新的限制。代码目前正在准备公开发布。

Rust 跨平台 GPUI 组件 Rust cross-platform GPUI components 35 天前

## GPUI 组件：一个基于 Rust 的桌面 UI 库 GPUI 组件是一个正在开发的跨平台 UI 库，用于使用 Rust 构建桌面应用程序，它利用 GPUI 渲染框架。它提供 60 多个受 macOS 和 Windows 美学启发的 UI 组件，并结合了现代 shadcn/ui 设计。主要特性包括无状态、易于定制的组件，内置主题和尺寸选项（xs-lg），以及通过停靠布局系统实现灵活的布局。性能是优先考虑的，虚拟化表格和列表组件可用于处理大型数据集。它还支持 Markdown、HTML、图表，以及具有 LSP 功能和 Tree Sitter 语法高亮显示的高性能代码编辑器。第一个使用 GPUI 组件构建的应用程序 Longbridge Pro 演示了多主题支持。目前通过 Git 依赖项访问 (`gpui = "0.2.2"`，`gpui-component = "0.3.0"`），该库是实验性的，存在一些限制，包括可选的 WebView 元素。示例和贡献指南可用，展示了它的潜力，以及与 Iced、egui 和 Qt 的比较。

发生了什么，以至于无法在自己的机器上运行想要的程序？ What happened to running what you wanted on your own machine? 35 天前

## 计算机自由的缓慢消亡数十年以来，个人电脑的核心自由在于运行任何你选择的软件的能力。从软盘到下载的演示程序，你的电脑由你控制。然而，这种自由正在迅速侵蚀，被伪装成必要的安全措施。谷歌最近宣布对安卓应用安装施加更严格的限制，使得“侧载”——在Play商店之外安装应用——变得越来越困难。这延续了苹果公司以iPhone的封闭花园式方法为先导的趋势，优先考虑精选的应用生态系统，而非用户选择。这并非新鲜事；游戏机早在几十年就率先推出了为盈利而锁定的系统。但将这种模式应用于通用计算机令人担忧。虽然安全性是一个有效的问题，但这些限制往往与公司控制和收入相一致。微软也曾尝试对Windows进行类似的锁定，但由于既定的用户期望而收效甚微。损失的不仅仅是便利性；它扼杀了实验、创造力以及通过动手实践学习的能力。一个软件需要公司批准的未来，将限制创新，并将个人计算转变为被动消费。最终，支持开放平台并用你的钱包投票，对于维护你所拥有设备的控制权至关重要。

Geoutil.com – 在浏览器中测量距离、面积和转换地理数据。 Geoutil.com – Measure distances, areas, and convert geo data in the browser 35 天前

## GeoUtil：一套免费、私密且强大的地理空间工具 GeoUtil 是一套完全基于浏览器的地理数据处理工具集，提供专业级别的功能，无需注册或上传数据，从而确保完全的隐私。所有处理都在您的设备上本地进行，即时完成。它支持多种格式，包括 GeoJSON、Shapefile、KML、CSV 等，并提供它们之间的**转换**工具。主要功能包括**距离和面积计算**、**方位角/航向查找**以及 **GeoJSON 统计分析**。除了基本操作外，GeoUtil 还提供高级功能，例如 **坐标参考系统 (CRS) 转换**、**坐标格式转换**以及 **合并和分割**地理空间文件的工具。它还包括 **数据压缩器**，可以显著减小文件大小。 GeoUtil 非常适合 GIS 专业人员、Web 开发人员、数据分析师以及任何需要私密高效地处理地理数据的人。它为每个工具提供详细的文档和示例。它是一套功能强大、免费的资源，可用于各种地理空间任务。

## GeoUtil.com：一款基于浏览器的地理工具包 GeoUtil.com是由FreeGuessr构建的一个新的、免费的地理数据分析网络工具包。它提供交互式地图工具，用于测量距离和面积，以及TopoJSON和GeoJSON格式之间的转换器，和坐标实用工具——所有这些都在客户端运行，以保证隐私和速度。创建者最初构建这些工具是为了与他们的地理猜谜游戏GuessWhereYouAre.com一起使用，发现缺乏简单的一体化解决方案来处理数据解析和地图工作等任务。用户反馈已经影响了开发，包括对距离测量中的小数精度、坐标输入选项、GPX文件支持以及基于日期的坐标转换的考虑等请求。虽然承认ESRI和QGIS等专业工具的存在，但创建者旨在为需要更简单解决方案的开发者、教育工作者和爱好者提供易于使用的工具。代码目前尚未开源，但未来正在考虑开源。

为什么 JPEG XL 忽略位深度是天才之举（以及 AVIF 无法做到这一点的原因） Why JPEG XL Ignoring Bit Depth Is Genius (and Why AVIF Can't Pull It Off) 35 天前

## JPEG XL：超越位深，实现卓越图像质量 JPEG XL 与 AVIF 等其他现代图像格式的不同之处在于一项激进的设计选择：它*忽略*位深。传统编码器通常关注 8 位、10 位或 12 位精度，而 JPEG XL 内部将所有图像数据转换为浮点数，将颜色表示为分数而不是固定的整数值。这并非一种限制，而是一种优势。人眼感知的是平滑度，而不是渐变中的步数。通过在连续的浮点空间中工作，JPEG XL 优化了*感知*保真度——图像的*外观*——而不是数值精度。 AVIF 基于视频编码器架构，仍然依赖于基于整数的编码，需要针对不同的位深采用不同的优化策略。相反，JPEG XL 使用感知锚点（强度目标）和独特的色彩空间（XYB）来智能地分配精度，使其在最重要的地方发挥作用，并能无缝适应不同的显示器和内容。这种方法简化了工作流程，确保了跨内容类型的一致质量，并为图像在显示技术不断发展的情况下做好准备。最终，JPEG XL 优先考虑的是保留*观看*的体验，而不仅仅是数字数据，使其成为真正具有前瞻性的图像格式。

最后一趟穿越海洋的欧洲火车 The last European train that travels by sea 35 天前

意大利本土与西西里之间的火车旅程包含一段独特的海峡渡轮，穿越墨西拿海峡，在乘客之间营造出一种令人惊讶的社群感。这段简短的20分钟海上航行鼓励人们交谈——关于生活、政治和旅行，并伴随着珍爱的仪式，例如光顾炸饭团柜台，那里的形状变化（卡塔尼亚是尖的，巴勒莫是圆的）反映了当地的自豪感。对于许多西西里人来说，在墨西拿港看到圣母雕像标志着“家”的欢迎。高效的转运过程，将车厢连接到渡轮，然后再连接到西西里铁路，是一项顺利的操作。沿着西西里东海岸的火车旅程提供了令人惊叹的景色——柠檬园、埃特纳火山的景色以及节日的装饰——完成了从米兰到锡拉库萨的20小时旅程，提供了一种真正身临其境的旅行体验。

## 最后一次跨海列车：一段怀旧之旅一篇BBC文章指出，一个时代的终结即将到来：最后一趟使用渡轮跨海的欧洲列车服务，连接意大利和西西里岛。这条独特的线路提供了一种更慢、更不被打扰的旅行体验——乘客享受为期两天的旅程，没有可靠的网络，促进了面对面的交流，并有机会从现代生活中解脱出来。评论者分享了在其他已停运的火车渡轮线路上的类似经历，特别是丹麦/德国和瑞典之间的线路，现在已被桥梁或隧道取代。许多人怀念这些旅程的魅力，并将它们与航空旅行的效率形成对比。虽然一座通往西西里岛的桥梁正在规划中，但一些人担心会失去这列火车提供的独特、感官丰富的体验。讨论还涉及更广泛的基础设施项目、进步与保护独特旅行体验之间的平衡，以及真正脱离网络的旅行日益稀缺等主题。最终，这篇文章引发了人们对一种正在消失的交通方式的怀旧之情。

如果你的对手是摩萨德 (2014) [pdf] This World of Ours (2014) [pdf] 35 天前

此文档似乎是PDF文件的内部结构，特别是其交叉引用表（xref）和流数据。**这不是人类可读的内容**，例如文本或图像。 `xref`表对于PDF阅读器定位文件中的不同对象至关重要——例如文本、图像、字体和元数据。数字（例如“134 42”）表示起始和结束对象编号。随后的“00000 n”行指向文件中每个对象开始的字节偏移量。 `stream`部分（由`stream`和`endstream`指示）包含压缩数据，可能代表一个或多个对象的实际内容。流中的字符是二进制的，在没有适当解码的情况下没有意义。本质上，这是PDF的“后台”，详细说明了内容*如何*组织，而不是内容*是什么*。没有PDF阅读器，它只是一系列数字和无法解释的字符。

每日HackerNews RSS