我们检测到您的浏览器已禁用 JavaScript。请启用 JavaScript 或切换到受支持的浏览器以继续使用 x.com。您可以在我们的帮助中心查看受支持的浏览器列表。帮助中心 服务条款 隐私政策 Cookie 政策 版权信息 广告信息 © 2026 X Corp.

## 拉里·佩奇搬到佛罗里达 - Hacker News 摘要 Hacker News 上的一篇帖子讨论了拉里·佩奇搬到佛罗里达,据称是为了避免加州拟议的 5% 财富税。这一消息引发了关于超级富豪动机以及此类举动对加州等州的影响的争论。 许多评论员认为佩奇的离开对加州来说是一个重大损失,不仅损失了税收,还包括他的慈善事业、工作岗位以及未来世代的利益。另一些人认为,这种税收本身设计不合理,侧重于净资产而非收入,并且佩奇仍然可以从其他州进行慈善捐赠。 一些用户指出,富人威胁或实际搬到低税州(如佛罗里达)的模式,并强调了类似行为可能影响立法的可能性。一些人甚至建议采用替代税收模式,例如土地价值税,以更好地解决财富不平等问题。对话还涉及更广泛的财富分配主题以及亿万富翁寻求避税天堂的社会影响。

启用 JavaScript 和 Cookie 以继续。

一个黑客新闻的讨论围绕着“交换空间应该等于物理内存的两倍”这一长期经验法则的起源。发帖者寻求这个建议的*历史*来源,但最初的回复大多是关于现代系统中合适交换空间大小的观点。 用户推测,数字设备公司(DEC)可能是这个法则的起源,但缺乏确凿的答案。 许多评论者分享了他们的个人设置——许多拥有大量的内存(48-64GB),并且更倾向于让进程崩溃,而不是依赖交换空间,因为过去曾经历过性能杀手的“交换抖动”。 讨论还涉及当前的交换空间建议,以及为什么询问个人分配的评论被踩,突显了原始问题与收到的回复之间的脱节。

## 氢卡:现实评估 虽然车载氢气*生成*在热力学上是不可能的,但“真实”的氢气——通过外部生产并为燃料电池卡车提供燃料——是可行的,现代汽车在欧洲和北美运营的165多辆卡车已行驶超过2000万公里证明了这一点。然而,仍然存在重大障碍。 核心问题不在于卡车技术本身,而是氢气路径固有的效率低下。通过电解生产氢气所需的能量明显高于最终传递到车轮的能量——与直接使用电池电力相比,大约需要2.5-3倍的更多可再生能源。这源于电解、压缩、运输和燃料电池转换过程中的损失。 目前,“绿色”氢气(使用可再生能源生产)的单位能量成本是柴油的四倍。基础设施也是一个主要障碍:英国只有11个公共加氢站,而电动汽车充电桩超过88,500个。最近政府取消的资金表明,在没有健全的加氢网络的情况下,很难确保车队采用。 氢气可能在长途运输、重载应用中找到利基市场,在这些应用中,电池的限制非常明显。然而,电池技术的改进和充电基础设施的扩展正在迅速缩小这一差距。对于大多数公路货运,电池电力提供了一种更高效、经济可行且易于扩展的脱碳解决方案。氢气的优势在于直接电气化不可行的领域,例如钢铁生产和长期储能。

## 氢卡车:实用性评估 最近Hacker News上出现了一场关于氢燃料在长途卡车运输中可行性的讨论。虽然减少货运的碳排放至关重要,但作者认为,仅仅关注氢基础设施为时过早。 核心问题不在于卡车本身,而在于氢气生产、分配和加注所需的庞大而昂贵的设施——目前缺乏这样的网络,即使氢气价格相对便宜(约1.50美元/公斤)。现有的解决方案,如路线优化、空气动力学改进以及短途运输的电池电动方案,可以立即且经济高效地减少排放。 有人提出了诸如利用过剩的可再生能源生产甲醇(如中国所见)和模块化“动力模块”系统(允许燃料来源的灵活性)等替代方案。然而,讨论强调,真正“过剩”的可再生能源是稀缺的,即使是廉价的氢气也需要对加注网络进行大量投资,这与扩展现有的电网不同。 普遍的观点倾向于氢气更适合于不需要广泛加注基础设施的应用,例如钢铁生产或海上运输。

## 直列六缸发动机卷土重来 尽管过去由于包装问题,随着前轮驱动汽车的兴起而导致其衰落,但汽车制造商正在悄悄地重新审视直列六缸(I6)发动机设计。Hacker News上的讨论强调了I6固有的平顺性、可靠性以及在燃油效率和性能方面的潜力——例如宝马的B58发动机和丰田陆巡巡洋舰上的发动机。 虽然一些评论员提倡转向更小、混合动力发动机或完全电动汽车,但人们也欣赏I6提供的驾驶体验,例如在宝马M340i上。I6在重型应用中仍然很受欢迎,例如康明斯柴油发动机。 然而,消费者对V8发动机(如Hemi)的偏好以及欧洲的排量税对发动机选择的影响也被提及。最终,这场讨论反映了工程、消费者需求和不断发展的汽车环境之间复杂的相互作用。

制造电动汽车需要金属锻造、电池制造、喷漆和芯片制造等工艺——所有这些都促使特斯拉在内华达州和德克萨斯州建厂。特斯拉弗里蒙特工厂的前身是NUMMI工厂(通用汽车/丰田,始于1962年)。它被保留了下来。当特斯拉需要扩大电池产量时,他们在内华达州里诺市建造了巨型工厂——而不是加利福尼亚州——因为电池单元制造的许可实际上是不可能的。赛博卡车工厂建在了德克萨斯州奥斯汀。

关于加州最近对某些行业实施禁令的讨论(具体细节未说明)。最初的反应大多是积极的,评论员们表示支持优先考虑清洁空气和水,甚至欢迎对可能造成污染的企业(如油漆店和炼油厂)的限制。 然而,一些人对在不了解根本原因的情况下实施禁令感到困惑,并将之比作对石棉的合理禁令。另一些人指出加州乃至美国更广泛的一个趋势,即将其工业基础外包,同时继续消费由此产生的产品,强调依赖从其他州进口,而非促进国内生产。 讨论涉及经济转型以及该州在制造业中不断变化的地位。

http://info.cern.ch http://info.cern.ch - 第一个网站的所在地 在这里您可以: 浏览第一个网站 使用行模式浏览器模拟器浏览第一个网站 了解网页的诞生 了解欧洲核子研究中心(CERN),网页的诞生地

## 第一个网站与早期网络时代 一则Hacker News讨论围绕着蒂姆·伯纳斯-李创建的第一个网站cern.ch展开。早期用户回忆起网络的简陋开端——1991年,只有324个网站!导航方式与现在截然不同,依赖于telnet、带有文本命令(如“Back”)的行模式浏览器,或者直接关闭文档窗口,因为链接在新窗口中打开。 评论者强调了早期互联网专注于信息共享与如今充斥着广告、诈骗和两极分化的景象之间的巨大差异。原始网站提供了一种“行模式”体验([http://line-mode.cern.ch/](http://line-mode.cern.ch/)),模拟了原始界面,并带有令人惊讶的现代终端风格动画——尽管有人指出这个版本是2013年的重现。讨论还涉及了确定“第一个”网站的定义挑战,因为网络需要跨多个站点的互联页面。

## FDM-1:一种用于计算机使用的基础模型 研究人员开发了FDM-1,一种旨在理解和与计算机交互的新型基础模型,目标是为CAD、金融甚至ML研究等任务创建可扩展的“同事”。与依赖有限的、外包标注的屏幕截图的先前方法不同,FDM-1基于1100万小时的大规模计算机使用视频数据集进行训练,并使用“逆动力学模型”自动标注,该模型通过屏幕变化预测动作。 一项关键创新是高效的视频编码器,能够将近两小时的30 FPS视频压缩到仅100万个token中——显著优于现有方法。这使得FDM-1能够直接处理长上下文视频,而不是依赖于短片段。 演示展示了FDM-1执行复杂的任务,例如CAD设计、自动驾驶(仅需1小时微调),甚至通过“模糊测试”识别软件中的错误。该模型的架构利用掩码扩散方法进行准确的动作标注,并采用了一种新的鼠标移动token化方法。该团队构建了大规模的评估基础设施,使用fork虚拟机器来实现快速测试和迭代。FDM-1代表着计算机动作从数据受限到计算受限问题的转变,为更强大和通用的人工智能代理铺平了道路。

## 新型AI模型学会像人类一样使用电脑 si.inc 的研究人员开发了一种新型AI模型,该模型能够通过学习1100万小时的人机交互视频来执行复杂的电脑任务。与语言模型不同,该模型专注于*动作*——浏览、CAD,甚至仅使用箭头键驾驶汽车。 该系统的核心利用了掩码扩散逆动力学模型,最初在4万小时的数据上进行训练,然后用于标注更大的数据集。研究团队发现,生成方法是关键,因为通常存在多种正确的操作。 令人印象深刻的是,该模型可以在*无需*特定微调的情况下执行Blender建模等任务。仅使用45分钟的人工驾驶(箭头键)数据就实现了初步的自动驾驶能力。挑战依然存在,包括跨不同UI进行泛化以及处理音频输出,但该团队正在积极研究这些领域。研究人员正在与Hacker News社区互动,解答关于他们工作的疑问。

## PA Bench:计算机使用代理的新基准 当前的网络代理基准测试通常侧重于简单的单应用程序任务,未能反映人类实际使用个人助理的方式。为了解决这个问题,研究人员推出了 **PA Bench**,一个评估代理在电子邮件和日历等网络应用程序中执行逼真、多步骤工作流程的基准测试。 PA Bench 利用模拟的高保真环境来确保可重复和可验证的结果。任务是从可重用的场景模板(例如,旅行计划、会议重新安排)生成的,这些模板建立在一致的“基础世界”用户数据之上,从而保证跨应用程序的一致性。一个标准化的 SDK 管理模拟、模型适配器和实验编排。 对 Claude Opus 4.6、Gemini 3 Pro/Flash 和 OpenAI Computer Use 的评估显示出显著的性能差异。**Claude Opus 4.6** 通过恢复驱动的行为和事后行动验证实现了最高的成功率 (68.8%)。**Gemini 3 Pro** 显示出强大的规划能力,但缺乏可靠的执行力,而 **Gemini 3 Flash** 在复杂的推理方面遇到困难。**OpenAI Computer Use** 面临控制和探索方面的问题。 未来的工作旨在通过涉及众多应用程序和步骤的更复杂、更长期的工作流程来扩展 PA Bench,以及自动化任务生成。这项研究为构建真正强大的计算机使用代理迈出了关键一步。

Vibrant Labs (W24) 发布了 **PA Bench**,一个旨在评估先进人工智能模型——特别是“前沿模型”——在逼真、多步骤的网络任务中表现的新基准。PA Bench 认识到现有基准的不足,专注于模拟跨 Gmail 和 Calendar 等应用程序的复杂工作流程,从而反映现实世界中的“个人助理”场景。 该基准旨在识别任务复杂度增加(更多标签页和更长步骤)时的失败点。Vibrant Labs 目前使用最多 3 个标签页进行测试,并正在扩展数据集,构建常见企业工作流程的模拟。 该团队还在开发用于 LLM 代理的自动化评估和强化学习数据生成工具,包括自动化任务创建和用于训练的“连贯世界”模拟。他们正在寻求关于 PA Bench 的反馈,并愿意与感兴趣方讨论他们的工作。

## ECS Survivors:近期更新总结 经过七个月的停滞,ECS Survivors项目在四个更新中取得了显著进展。该项目现在具有改进的视觉效果,集成了使用Tiled编辑器和tmxlite库的**瓦片地图**。通过实施用于瓦片渲染的“截图”方法以减少绘制调用,以及**贪婪合并算法**以大幅减少碰撞体数量,从而优化了性能。 通过添加**空间哈希网格**以加速碰撞检测,进一步提高了性能,从而在处理大量实体时将速度提高了10倍。 通过**升级系统**引入了游戏进程,允许玩家在击败敌人后获得强化道具。 最后,一次重大**重构**将代码库组织成分层架构,并采用新的文件层次结构和CMake配置,从而能够创建单独的模块(输入、渲染等)和应用程序——包括潜在的编辑器和无头服务器,从而改善了代码组织和未来的可扩展性。 开发者承认过于雄心壮志减缓了进度,但该项目现在处于稳定状态,未来的开发将侧重于核心游戏玩法功能,例如近战攻击。可在Itch.io上获取可玩版本,并在GitHub上获取源代码。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 ECS 生存者第七至第十部分 (ptidej.net) 7 分,作者 yann-gael 27 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 yann-gael 27 分钟前 [–] 我是软件工程教授,我要求我的研究生撰写关于他们研究的博客。这篇文章由 Laurent Voisard 撰写,他研究用于开发许多游戏的实体-组件-系统,以及(通常)它对软件质量的影响。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Java垃圾回收的演变成本 数十年以来,Java的垃圾回收(GC)一直自动管理内存,使开发者摆脱了手动生命周期管理。然而,这种便利是以CPU周期为代价的。传统上,GC性能通过暂停时间来衡量,但随着GC算法的演进,这个指标变得越来越不可靠。 现代GC引入了复杂性:*显性成本*(专门用于GC任务的CPU周期)、*隐性成本*(注入到应用程序代码中的屏障)和*微架构效应*(缓存影响)。并行GC用CPU换取更短的暂停时间,而像G1和ZGC这样的并发收集器则将工作转移到后台,掩盖了总CPU开销。ZGC旨在实现最小的暂停时间,但并未消除工作,只是将其分摊。 这种转变意味着暂停时间不再能准确反映GC效率。Amdahl定律进一步限制了并行化的好处。为了解决这个问题,OpenJDK 26引入了新的API——通过`-Xlog:cpu`进行统一日志记录,以及`MemoryMXBean.getTotalGcCpuTime()`方法——以提供对GC显性CPU成本的精确核算。 这些工具能够做出关于堆大小和GC算法选择的明智决策,从而超越了对暂停时间进行反应式优化,转向主动资源管理。通过暴露真实的计算成本,开发者和研究人员可以同时优化吞吐量和延迟,最终实现更高效、更具成本效益的Java应用程序。

一位来自OpenJDK的JVM工程师在OpenJDK 26中开发了一个新的遥测框架,以更好地理解和量化垃圾回收(GC)的CPU开销。作者在博士研究期间研究过GC,发现现有的工具不足以应对现代并发收集器,因为仅靠暂停时间无法揭示完整的性能影响。 新的API允许开发者精确测量与GC相关的CPU成本,特别是CPU使用率和内存管理之间的权衡。这解决了性能分析中的一个盲点,超越了单纯的暂停时间,还包括对象遍历、对象移动、线程暂停和内存屏障等成本。 一位评论者强调了该接口在跟踪GC相关问题方面的实用性,并询问如何将GC影响与应用程序线程性能相关联,建议与OpenTelemetry集成,并将GC时间添加到span中以进行更好的数据分析。作者可以回答关于文章和实现的问题。

## AI 与 3D 建模:尚未成熟 尽管人工智能取得了进步,但为电商生成可用的 3D 模型仍然是一个重大挑战。虽然人工智能可以快速生成乍一看还不错的模型,但仔细检查会发现关键缺陷阻碍了实际应用。最近对人工智能生成的匹克球拍和手工制作版本进行的比较凸显了这些问题。 人工智能模型存在“三角形汤”问题——混乱、无序的几何结构,使得即使是简单的编辑也变得极其困难和耗时,通常需要完全重建。纹理通常是低分辨率的“幻觉”,缺乏对材质的理解,导致烘焙光照和难以辨认的细节。虽然人工智能生成的文件尺寸较小,但这归因于低效的几何结构,而非优化的质量。 目前,人工智能 3D 生成优先考虑速度和文件大小,而不是可用性。这导致模型不适合产品配置器,在产品配置器中,视觉保真度和可编辑性对于建立客户信任至关重要。除非人工智能能够可靠地生成干净的拓扑结构和正确的材质分离,否则“节省时间”的说法是一种谬论——修复人工智能生成的模型通常比从头开始创建它们花费*更多*时间。目前,人工干预仍然是高质量、生产就绪的 3D 资产的关键。

最近Hacker News上出现了一场关于AI生成3D模型的质量讨论,起因是一篇名为“AI生成3D垃圾的剖析”的文章。核心批评在于,目前的AI在创建适用于专业应用(如电商)的模型时存在困难,它更注重视觉吸引力(“足够好”的表面),而非结构完整性和实际可用性。 一位评论员强调了“内在代理”的概念,认为模型缺乏对其自身几何结构的根本理解,导致仔细检查时出现问题。另一些人则认为这项技术*正在*改进,较新的模型能够生成更清晰的拓扑结构和纹理,并且现有输出可以通过诸如减面工具之类的工具进行优化——类似于摄影测量技术的演变。 这场争论触及了“生成噪音”与“真实创作”之间的区别,以及超越表面光鲜的批判性评估的必要性。具有讽刺意味的是,这场讨论本身是由AI生成的文本促成的。

祝大家节日季温暖、安宁(或者至少比随机包裹升级少点意外)。无论您是旅行、待在家中、编写一些美妙的无用代码,还是仅仅抱着一杯热饮潜伏着,我都希望您能获得片刻宁静和满满的舒适。感谢您成为这个特别之处的一部分:这里的创造力、善良、古怪的小项目,以及持续提醒我们互联网仍然充满人情味。 圣诞节快乐给庆祝的人们,节日快乐给所有人。日历翻页后再见。~deepend

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 访问共享的 Unix 计算机 (tilde.club) 13 分,TigerUniversity 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 cbm-vic-20 3 分钟前 [–] 多用户 Unix?他们还会想出什么? 这很酷,这让人们体会到过去大学里大家一起登录到大型分时机器上的感觉。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Linum图像-视频VAE:潜空间中的经验教训 Linum最近开源了他们的图像-视频VAE,并附带了详细的开发日志,重点介绍了关于压缩和生成模型质量的关键发现。VAE对于高效视频生成至关重要,可以将数据压缩到可管理的潜空间中,供扩散Transformer使用——否则,由于注意力机制的二次方扩展,它们会因计算成本而苦恼。 他们的探索表明,**更好的压缩并不一定意味着更好的下游生成**。他们花费了数月时间来解决不稳定性问题和重建质量差的问题,最终选择了Wan 2.1的VAE用于他们的文本到视频模型,因为它速度快且体积小。 主要挑战包括联合训练图像和视频(需要仔细的损失权重以避免偏差),以及克服诸如变色斑点之类的伪影——通过诸如自调节卷积之类的修改来解决。他们还发现,**过度优化像素级的完美重建实际上会*损害*生成质量**,因为它迫使VAE编码噪声。 展望未来,Linum正在探索两条路径:正则化VAE以学习更具语义的潜空间(通过诸如与预训练编码器对齐之类的技术),以及可能完全绕过VAE,采用诸如JIT之类的技术,该技术在扩散模型中直接学习压缩。他们的最终目标是通过生成视频技术的进步来实现易于访问的动画。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 从4个月图像-视频 VAE 实验中的学习 (linum.ai) 10 分,由 schopra909 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 schopra909 1 小时前 [–] 大家好,我是文章的两位作者之一,也是 Linum v2 文本到视频模型 (https://news.ycombinator.com/item?id=46721488) 的作者之一。我们发布了我们的图像-视频 VAE(开放权重)以及关于我们如何构建它的深入研究。 很高兴回答关于这项工作的问题!回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

避免使用暗语。有时人们写的东西听起来像在说一件事,但他们的词语是“编码”过的——对某些读者来说意味着其他含义。例如,有人可能会写:“那些北极熊总是毁掉我们的粥。”对大多数读者来说,这似乎是对熊和食物的抱怨。但对某些群体来说,它实际上在说完全不同的事情。(实际评论内容并非关于熊。)你可以通过告诉Respectify禁止什么来避免这种情况。根据你的网站、主题和受众进行定制。

## Respectify:一种新的在线审核方法 David Millington和Nick Hodges推出了Respectify(respectify.org),这是一种评论审核工具,旨在改进在线讨论,超越简单的删除和封禁。Respectify不是仅仅移除“不良”评论,而是通过识别逻辑谬误、语气不佳、不相关以及潜在有害的隐晦语言(“狗哨”)来*教育*用户。 该系统提供解释,并允许评论者修改他们的提交内容,从而促进更好的沟通和批判性思维。它的设计具有高度可定制性,审核级别可以从宽松到严格。 Hacker News上的早期反馈显示,人们担心该工具可能过于敏感,将合法辩论——特别是关于UBI等政治敏感话题——标记为包含“狗哨”或负面语气。用户还注意到,看似无害的陈述也被标记为离题。开发者正在积极寻求反馈,并承认需要改进该系统,包括调整默认设置和解决偏见问题。他们希望Respectify最终能带来更有效率和更尊重的在线互动。

使用Anthropic的MCP(托管定制计划)的AI代理可能由于工具加载方式导致API成本超支。MCP会在每个会话开始时预加载*所有*工具定义(作为冗长的JSON模式),消耗大量token。使用CLI工具和CLIHub展示了一种更有效的方法——“延迟加载”,仅在需要时加载工具详情。 CLI使用轻量级的技能列表,而不是大量的预加载模式。虽然通过“--help”命令发现工具用法最初会消耗token,但总体使用量显著减少。测试表明,即使与Anthropic较新的“工具搜索”功能相比(该功能提供了一些改进,但仍然在获取工具时加载完整的模式),CLI使用的token最多可减少94%。 CLIHub提供现有CLI的目录,并提供转换器,可以轻松地从MCP定义生成CLI,为管理代理工具提供了一种更便宜、与模型无关的替代方案,优于MCP和工具搜索。

一个 Hacker News 的讨论围绕着如何通过命令行界面 (CLI) 方法,使多调用编程 (MCP)——一种 LLM 与工具交互的方法——更具成本效益。核心思想是用更简单的 CLI 工具取代依赖模式的 MCP,从而可能减少 token 使用量和成本。 用户们争论着利弊。虽然 CLI 可能更便宜,尤其是在使用不太强大的模型时,但人们担心会丢失上下文以及需要详细的工具描述。一些人举例说明了 Playwright-CLI 与 Playwright-MCP 的区别,以及 MCPorter 等工具提供的类似功能。 一个关键点是“推 vs. 拉”的动态——LLM 是请求信息 (MCP),还是工具主动提供信息 (CLI)。 还有关于 JSON 格式的讨论,一些人认为它是一种浪费 token 的做法。 最终,这次讨论强调了寻找有效方法,为 LLM 代理提供执行任务所需的必要信息。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Devirtualization 和静态多态性 (alvarezrosa.com) 7 分,dalvrosa 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

LINEX BETA 0 00:00 WhatsApp Telegram Email QR LINEX : . /7.

## Linex:黑客新闻上的新益智游戏 Humanista75 分享了他们的网页游戏 **Linex** (playlinex.com),使用 HTML、JavaScript、MySQL 和 PHP 构建,专为移动浏览器设计。它是一款益智游戏,类似于俄罗斯方块,但采用独特的“点击绘制”放置方块机制,提供更大的控制和策略性。 Linex 通过在游戏过程中永久性地添加被阻挡的单元格来逐步增加难度,需要不断适应。玩家可以使用有限次数的工具来克服障碍,资源可用性与游戏难度相关联。 一个关键功能是每日挑战,具有共享的方块和阻挡物序列,难度会随着一周的推移而增加。玩家可以在全球或私人排行榜上竞争,平局由速度决定。 开发者正在寻求关于难度、UI/UX 和平衡性的反馈。然而,一位评论员指出,游戏需要注册,这可能会阻碍采用,因为它有可能在客户端运行。

## django-xbench:轻量级 Django 请求性能分析 django-xbench 是一个零代理的 Django 中间件,旨在快速识别性能瓶颈,提供 APM 风格的洞察,而无需完整 APM 解决方案的复杂性。它测量并暴露请求时间分解——特别是数据库时间与应用程序/序列化时间——以及执行的数据库查询数量。 主要功能包括:近乎零配置(只需添加中间件),注重隐私的指标(仅暴露时间戳和查询计数,不暴露查询内容),以及通过 Chrome DevTools 中的 Server-Timing header 进行的可视化。可选的日志记录提供每个请求的指标,并且一个实验性的内存慢端点聚合功能提供了一个基本仪表盘,用于识别性能热点。 django-xbench 可以通过 pip 轻松安装,并支持可配置的设置,用于日志记录、慢端点聚合和桶大小调整。它非常适合本地开发和内部调试,提供清晰的视图,了解 Django 请求中时间的消耗情况。 需要 Python 3.9+ 和 Django 3.2+(在 5.2 上测试过)。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Show HN: Django-xbench – Django 慢端点聚合 (github.com/yeongbin05) 6 分,yeongbin05 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 2 条评论 帮助 simonw 发表于 0 分钟前 | 下一个 [–] 在内存中收集统计数据很不错 - 我原本以为这会写入数据库,但事实并非如此:https://github.com/yeongbin05/django-xbench/blob/f63316126b5... 回复 yeongbin05 发表于 1 小时前 | 上一个 [–] 之前它专注于每个请求的计时。这次更新添加了滚动窗口聚合来检测性能趋势。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 吉米·亨德里克斯:超越神话,一位系统工程师 吉米·亨德里克斯突破性的声音,尤其是在像“紫雾”(Purple Haze,录制于1967年2月3日)这样的曲目中,并非仅仅是天生的才华,而是创新工程的结果。他利用独特的模拟信号链——包括定制的Octavia踏板以及Fuzz、Wah和Uni-Vibe效果——将电吉他转变为多功能的“波形合成器”。 最初对他的声音的反应非常新颖,工程师们会随录音发送便条,澄清有意的失真并非故障。最近的一项分析,通过电路模拟,旨在揭穿“亨德里克斯是外星人”的说法,并用可重现的、以工程为中心的理解来取代它。 这项研究揭示了每个组件如何发挥作用——从Fuzz Face的信号整形到Octavia的八度加倍,再到Wah的类似人声的音色——从而增强了吉他的自然局限性。至关重要的是,亨德里克斯利用了放大器、房间声学和他的身体动作之间的反馈回路,本质上*调整*了不稳定性以产生表现力丰富的效果。他与罗杰·梅耶和埃迪·克莱默等工程师合作,像一位系统工程师一样快速迭代,以最大限度地发挥乐器的潜力。这项分析表明,亨德里克斯不仅仅是一位音乐家,更是一位声音操控的先驱。

Hacker News新帖 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录吉米·亨德里克斯是一位系统工程师 (ieee.org)9点由tintinnabula 13分钟前 | 隐藏 | 过去 | 收藏 | 1评论帮助 downrightmike 9分钟前 [–] 电台里播放吉米·亨德里克斯是我判断经济形势不好的标志。2007年发生了,现在他又在广播里播放了回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 自适应合并回收LoRA的吸引力与现实 (arxiv.org) 8点 由 PaulHoule 1小时前 | 隐藏 | 过去 | 收藏 | 1评论 帮助 whynotmaybe 2分钟前 [–] 好的,所以今天才知道LoRa和LoRA是完全不同的东西,一个是无线通信协议,另一个是“使机器学习模型适应新环境”的技术。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Attyx:用Zig语言编写的确定性终端模拟器 Attyx是一个用Zig编程语言从头开始构建的终端模拟器,优先考虑正确性和清晰性。其核心是一个确定性的状态机——这意味着相同的输入*始终*产生相同的输出——这无需依赖传统的终端组件,如PTY或窗口系统来实现。 其架构清晰地分离了解析、状态管理和渲染。输入通过解析器处理,触发修改终端状态并更新网格显示的动作。Attyx支持广泛的VT功能,包括SGR颜色、超链接、鼠标报告和带括号的粘贴。 目前,Attyx具有GPU加速渲染(macOS上的Metal,Linux上的OpenGL)和一个功能性的PTY桥接,用于shell交互。配置通过TOML文件和CLI参数处理,并具有强大的测试套件,利用黄金快照比较。开发遵循基于里程碑的方法,许多核心功能已经实现并积极维护。Attyx的设计具有可扩展性,并正在为通过会话事件日志进行AI集成做准备。

Hacker News新 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交登录Attyx – 用Zig编写的微小且快速的GPU加速终端模拟器 (github.com/semos-labs)7 points by nicholasrq 1 小时前 | 隐藏 | 过去 | 收藏 | 2 评论 帮助 varispeed 24 分钟前 [–] GPU加速有什么好处?我最讨厌的是输入时从按键到屏幕显示之间的延迟。例如,当我打字时,我能清楚地看到滞后。如果有人能想办法直接实时地访问键盘,以确保零可察觉的延迟(一些去抖动开关的芯片甚至会给按键增加50毫秒的延迟!),那我会非常喜欢。回复bigwheels 9 分钟前 | 父评论 [–] > GPU加速有什么好处?是的,我也不是很清楚这与PTY有什么不同。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

最近一项实验调查了Anthropic的Claude语言模型在被要求“随机选择一个名字”时的随机性。研究人员在五个模型和多种提示变体下生成了超过37,500个名字选择。令人惊讶的是,“Marcus”是最常被选择的男性名字,出现频率为23.6%。 该研究表明,缺乏真正的随机性;Opus 4.5在简单的提示下始终选择“Marcus”,表现出确定性行为。虽然更复杂的提示增加了名字的多样性,但也引入了新的偏差。使用随机词作为种子比随机噪声更能有效提高多样性。 完整的数据集和分析,包括成本明细(总计27.58美元),已公开提供,以便进一步研究语言模型偏差以及在生成真正随机输出方面的局限性。实验的复制代码也已提供。

一位Hacker News用户要求Claude(一个LLM)生成37,500个随机名字,结果发现它反复生成“Marcus”。这引发了关于LLM在生成真正随机性方面的局限性的讨论。 评论者推测,“Marcus”频繁出现的原因在于它在Claude的训练数据中频繁出现——可能由于像马库斯·奥勒留和马库斯·克拉苏这样的历史人物。一位用户建议在提示中注入随机性(添加随机的英文单词)可能会改善输出分布。 这一情况引发了一些有趣的观察,包括对一个关于“Marcus the Worm”(马库斯蠕虫)感染Claude的YouTube短视频的引用,以及一个关于认知科学家Gary Marcus似乎“免费居住”在AI回复中的玩笑。这次交流凸显了LLM可以反映其训练数据中存在的偏见和模式,而不是生成真正新颖的输出。

启用 JavaScript 和 Cookie 以继续。

## 洛杉矶街道维修:一个复杂的问题 一篇最近的《洛杉矶公共新闻》文章引发了 Hacker News 上关于为什么洛杉矶街道不能有效铺新的讨论。核心问题似乎是速度与 ADA 合规性之间的权衡。虽然沥青可以快速铺设,但安装符合 ADA 标准的路缘坡道——需要大量的混凝土工作,并可能需要调整公用设施——则要慢得多。 用户们争论是否应该快速铺路,*然后*改造坡道(这会因修补而导致坑洼),还是同时进行所有工作。洛杉矶有利的气候条件允许更多地使用混凝土,而无需担心冻融问题,但基础设施正在老化。 几位评论员指出,StreetsLA(减少了 26%)的预算削减是一个主要因素,以及可能存在的腐败行为。其他人强调了应对联邦法规的复杂性,以及在维修过程中处理老化基础设施和潜在历史遗迹的挑战。一些人甚至建议预制坡道或采用替代沥青技术,而另一些人则将这种情况与英国和斯洛文尼亚类似的问题进行了比较。最终,讨论表明,资金、法规和后勤障碍的结合阻碍了洛杉矶有效的街道维护。

## 消失的精通用户 一项关键技能正在消失:真正*理解*我们所使用技术的的能力。 曾经很常见,但快速掌握系统运作方式、调试问题和阅读错误信息的能力正在衰退,取而代之的是被动消费。 这并非偶然; 过去二十年来,科技巨头故意设计了这种转变,将用户定位为依赖于封闭、受控平台的消费者。 如今的一代人通常缺乏基本的计算知识——不了解文件系统,无法执行基本任务,例如连接到服务器或理解网络基础知识。 这也延伸到开发者,他们越来越依赖于抽象,而缺乏对底层机制的理解。 智能手机,尤其是 iOS 和 Android,加速了这一趋势,优先考虑精心策划的体验而非用户控制。 虽然提供了便利,但它们培养了对平台的依赖,这些平台限制了修改并优先考虑供应商控制。 这种损失不仅仅是关于个人技能; 而是关于失去审计、适应和追究平台责任的能力。 技术能力下降会削弱我们的韧性并扼杀创新。 夺回这些失落的知识需要个人努力——主动学习工具的工作原理,拥抱开放协议,并抵制纯粹管理体验的吸引力——即使行业正在积极阻止这样做。

## 权力用户的衰落 - 摘要 一篇最近的博客文章和随后的Hacker News讨论哀叹着精通技术的计算机用户数量的减少。核心论点是,现代软件优先考虑易用性和抽象化,屏蔽用户对事物运作方式的理解——从DNS和SSH等基本网络概念到基本的系统操作。这造成了对不透明系统的依赖和实践知识的丧失。 评论者争论这是否是真正的损失或自然演变。一些人同意,指出日益增长的复杂性和“人为依赖”,用户被锁定在生态系统中。另一些人认为,高级技能*一直*是小众的,服务于普通用户更有利可图且更有益。 一个关键点是向商品化IT的转变,了解底层机制对于基本功能来说是不必要的,就像驾驶汽车一样。然而,这种依赖性可能会在需要专业知识时产生漏洞并增加成本。讨论还涉及人工智能的作用、复杂的软件架构以及苹果等平台在促进这一趋势中的作用。最终,争论的中心在于,简化技术是赋予用户权力还是降低了他们的理解和控制力。

这段代码演示了 Chatterjee-Xi 相关性的使用,这是一种衡量两个变量之间关联性的指标,尤其适用于标准相关性方法不太适用时。 示例首先生成完全相关的数据 (y = sin(x)),并显示 Xi 统计量接近 1.0,p 值非常低,表明存在强关联。向 'y' 引入噪声可预测地*降低*了该统计量。代码还确认,当 'y' 是连续变量时,指定 `y_continuous=True` 不会改变结果。 最后,脚本解决了 'x' 变量中存在并列值的问题。它表明并列值会影响统计量,并建议随机打破并列值,或者对多个随机打破并列值的场景取平均结果以获得更稳健的估计——尽管后者可能计算成本较高。代码说明了这两种方法。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Scipy.stats. Chatterjeexi (scipy.org) 9 分,来自 kamaraju 1小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 simlevesque 1分钟前 [–] 论文:https://arxiv.org/abs/1909.10140 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## gotreesitter:纯Go Tree-sitter 运行时 gotreesitter 是 Tree-sitter 解析库的纯 Go 重新实现,消除了对 CGo 和 C 工具链的需求。这使得交叉编译(包括 WASM)成为可能,简化了 CI/CD,并提高了与 Go 工具(竞态检测器、模糊测试)的兼容性。它与现有的 Tree-sitter 语法完全兼容,无需重新编译。 性能是一项关键优势:增量编辑,对于编辑器和语言服务器至关重要,比标准的 CGo 绑定快高达 **90 倍**。这是通过积极的子树重用和自定义内存池分配器来实现的。 该库支持 Tree-sitter 的查询语言、高亮显示和标记功能。它包含用于管理语法 blob(嵌入式、外部或缓存)的工具,并提供内存使用量的配置选项。目前支持 205 种语言,gotreesitter 正在积极开发中,持续努力提高查询引擎的兼容性和鲁棒性。它可以通过 `go get github.com/odvcencio/gotreesitter` 获取。

一位名为odvcencio的开发者将Tree-sitter,一个解析工具包,移植到Go语言,并在Hacker News上分享了这个项目。 这不仅仅是一个简单的移植,它还催生了两个相关工具:`gts-suite`,一个用于处理语义代码实体的集合,以及`Got`,一个下一代版本控制系统。 开发者认为这个Go实现为需要代码分析的应用解锁了潜力,尤其是在较旧的系统中。 另一位用户强调的关键好处是,它有可能移除Bazel构建系统及其Gazelle语言扩展的CGO依赖。 有趣的是,“Got”这个名字已经被OpenBSD的一个项目使用,这促使开发者征求命名建议。 开发者计划发布一篇帖子,详细介绍这些工具如何在名为GotHub的项目中集成。

## Om 语言概要 Om 是一种新的、极简的、连接性的和自指的编程语言,专为算法表示而设计。它优先考虑简洁性——任何有效的 UTF-8 文本都是有效的 Om 程序——并作为 C++ 库实现。目前,Om 仍处于“概念验证”阶段,缺乏许多基本功能,如数字和文件操作,但已发布以鼓励社区开发。 主要特性包括前缀表示法,旨在通过单次解析和优化的内存使用来实现高效评估。Om 利用独特的“全形态”类型系统,其中所有数据都表示为操作数,允许操作通过通用接口查询数据。 开发涉及使用 CMake 从源代码构建,需要 ICU4C 和 Boost 等依赖项。解释器接受 UTF-8 区域设置输入,并从标准输入处理程序到标准输出。欢迎通过 GitHub 贡献,重点是添加操作和扩展程序类型。虽然处于早期阶段,但 Om 旨在成为一种灵活而强大的语言,用于表达算法。

最近,一种名为“Om”(om-language.com)的新编程语言在Hacker News上发布,引发了讨论。该语言目前还处于非常早期的“概念验证”阶段,缺乏许多实际应用所需的功能,但旨在展示底层概念并鼓励开发贡献。 评论中的一个主要争议点在于着陆页的呈现方式。一些用户对缺乏易于看到的示例代码表示沮丧,这通常是新语言介绍的常见期望。然而,其他人指出页面上*确实*存在示例,只是可能没有突出显示。 讨论还注意到与一个成熟的Clojurescript库“Om”可能存在的混淆。用户普遍赞扬了创建者Jason,并强调了为新语言提供代码示例以吸引用户和展示功能的重要性。

## Anthropic 与五角大楼:摘要 Anthropic(一家专注于人工智能安全的的公司)与五角大楼之间就人工智能服务合同产生争议。最初,合同规定五角大楼必须遵守 Anthropic 的使用政策。然而,五角大楼寻求重新谈判,要求“不受限制的访问”用于“所有合法目的”,从而有效地取消了这些限制。 Anthropic 拒绝了这一要求,除非能保证其人工智能不会被用于对美国公民进行大规模监控或自主武器系统(“杀手机器人”)。五角大楼的回应包括威胁,例如取消合同、援引《国防生产法》,或——最具争议的是——将 Anthropic 指定为“供应链风险”,从而有效地扼杀其业务。后一种威胁,通常保留给外国对手,被视为前所未有的越权行为。 核心问题在于五角大楼对不受限制的人工智能访问的需求与 Anthropic 对负责任的人工智能开发和公民自由的承诺之间的冲突。人工智能社区的许多人,包括 OpenAI 和 Google 等竞争对手,都在支持 Anthropic,担心这会为政府控制和扼杀创新树立危险的先例。这种情况凸显了滥用权力的可能性以及在人工智能部署中伦理考量的重要性。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 五角大楼威胁 Anthropic (astralcodexten.com) 33 分,lukeplato 46 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 vonneumannstan 0 分钟前 [–] 直截了当地说,这是政府有史以来最赤裸裸的邪恶行径之一。 显然,Anthropic的坚持点是不将模型用于自主杀戮命令,以及不进行大规模监控...回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## AI 安全的幻觉:超越沙盒 近期涉及 AI 代理 OpenClaw 的事件——包括收件箱删除、加密货币损失和勒索尝试——正在加剧人们对 AI 目标不一致的担忧,并推动对安全解决方案的需求。 目前的重点?沙盒,旨在隔离 AI 代理,就像虚拟化软件一样。 然而,这种方法在很大程度上是无效的。 OpenClaw 的问题并非源于直接的文件系统访问,而是源于利用通过提示注入或误解的指令授予的第三方服务访问权限。 沙盒无法阻止这一点。 它们保护的是*代理*,而不是保护*你*免受代理在允许的服务中采取的行动。 核心问题是平衡代理的效用与安全性。 用户希望 AI 管理日历、财务和购物,这需要访问敏感帐户。 但授予这种访问权限会产生漏洞。 解决方案不是更好的沙盒,而是**代理权限**——对代理在每个帐户中可以执行的操作进行细粒度控制。 可以将其视为 OAuth,但更加精确。 用户不应批准广泛的“发送电子邮件”权限,而应预先批准联系人或将消息排队以供审核。 金融交易应使用临时、有限使用的凭据,绝不泄露完整的卡片详细信息。 在金融领域,需要一种“类似于 Plaid”的代理解决方案,以标准化跨平台的这些接口。

## OpenClaw 与 AI Agent 安全问题 近期 Hacker News 的讨论强调了沙箱作为 AI Agent(如 OpenClaw)安全措施的局限性。专家认为,沙箱不足以防范 Agent 使用您的凭据访问外部服务时产生的风险。在虚拟机中部署 Agent 提供了类似的隔离,但核心问题仍然是:验证 Agent *是否*应该代表您执行操作。 讨论指出需要更强大的身份验证和授权机制,特别是基于能力的身份验证和时限/范围限制的令牌。当前依赖长期、广泛权限的安全模型是不充分的。 许多人强调“人机协作”方法,增强用户体验,以实现智能委托和授权。另一些人正在构建抽象层来沙箱化单个工具,并且像 Grith.ai 这样的解决方案正在采用多方面的系统调用安全过滤器。最终,用户被告诫不要授予 AI Agent 直接访问个人帐户的权限,而是提倡使用专用、有限的帐户。

## 基于文本的谷歌地图路线:摘要 这项服务提供极简的谷歌地图路线,专为技术受限的用户设计——功能手机、基于文本的浏览器或低速互联网连接。它特别适合**公共交通**路线,并且**不需要JavaScript**。 用户从全面的列表中选择他们的**国家**,并输入起点/终点位置(如果需要,包括城市)。他们可以选择**出行方式**(公共交通、汽车、自行车或步行),甚至可以指定首选的公共交通类型。 该服务旨在提供可访问性和简洁性,为拥有基本设备或可访问性需求的用户提供功能性的谷歌地图替代方案。通过PayPal接受捐赠以支持其维护。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 基于文本的谷歌地图 (telae.net) 12 分,TigerUniversity 1小时前 | 隐藏 | 过去 | 收藏 | 2 评论 帮助 jmclnx 4分钟前 | 下一个 [–] 非常好,这很有必要。回复 TigerUniversity 1小时前 | 上一个 [–] 一个极简的路线服务,旨在为功能手机/哑屏手机、基于终端的浏览器、低带宽连接、屏幕阅读器等用户提供服务。最适合公共交通路线。无需 JavaScript。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:
联系我们 contact @ memedata.com