MemeData

Rewriting Bun in Rust 3 天前

我喜欢的一道软件工程面试题：计算中位数 A software engineering interview question I like: computing the median 3 天前

作者主张将“计算中位数”作为高质量的软件工程面试题。相比简单的“Fizz Buzz”测试，该问题能更全面地评估候选人的技术成熟度和思维深度。这项练习要求候选人在多个实际工程权衡中做出选择，包括 API 设计、副作用（可变性）以及排序的性能考量。同时，由于逻辑中常包含“差一错误”（off-by-one errors）以及针对数组长度奇偶性的分支判断等陷阱，该问题也为观察候选人的调试习惯提供了天然场景。除了代码实现，该问题还是深入探讨统计概念（例如为何中位数通常比平均数更稳健）以及考察候选人是否能有效利用标准库的绝佳切入点。归根结底，该任务因其简洁性而具备极高的可测试性，同时能清晰揭示候选人是否能审慎地思考其代码所带来的影响。

围绕“中位数计算”这一面试题的讨论，揭示了招聘实践中存在的巨大分歧。 **批评者**认为，此类问题属于“计算机科学入门级的自我陶醉”，对于大多数行业岗位而言毫无意义，因为开发者几乎不需要从零开始计算中位数。他们指出，这些难题忽视了系统设计、沟通能力、错误处理及学习能力等高级职场必备技能。此外，许多面试官往往抱有刻板的预期（例如“必须对数据进行排序”），而忽略了快速选择（Quickselect）或流式算法等更高效的方案。 **支持者**则为该问题辩护，认为这是筛选无法编写基础代码的应聘者所必需的手段。他们认为大规模招聘需要一个“漏斗”来快速剔除不合格者。在验证了基本能力后，他们会转而探讨更深层的问题，如权衡考量（例如内存限制、数据流和时间复杂度）。最终，业界的共识倾向于将简单易懂的问题作为切入点——其目的不在于考察死记硬背，而在于评估候选人的解决问题的思路、学习意愿以及进行有效技术对话的能力。面试的价值不在于“正确”的代码，而在于对现实约束条件的共同探索。

Show HN: Frugon – 找出哪些 LLM 调用可以改用更便宜的模型处理（本地运行，MIT 协议） Show HN: Frugon – Find which LLM calls a cheaper model could handle (local, MIT) 3 天前

**Frugon** 是一款免费、本地化且开源的工具，旨在通过检查您的实际调用日志来分析并优化大语言模型（LLM）的成本。由于它完全在您的机器上运行，您的数据和 API 密钥将始终保持私密，绝不会与第三方共享。 **工作原理：** * **捕获：** 使用 `frugon capture` 作为本地代理，将应用程序的 LLM 流量记录为 JSONL 日志。您也可以直接提供现有的日志文件。 * **分析：** 运行 `frugon analyze` 以生成详细的成本分析报告。该工具会将您当前的支出与各种模型替代方案进行比较，识别出哪些调用可以在不牺牲性能的前提下转向更便宜的模型。 * **评估：** 您可以选择使用 `--measure` 标志，利用您自己的供应商密钥针对真实流量对候选模型进行测试，确保在切换之前维持高质量表现。 Frugon 提供清晰且可操作的建议，例如“将困难任务保留在当前模型，将简单任务转移到更经济的模型”，从而帮助您显著节省每月的 LLM 开支。该工具轻量化，能快速处理超过 10 万条记录，并支持输出用于预算审查的专业报告。如需持续、自动化的路由功能，请访问 [frugon.rodiun.io](https://frugon.rodiun.io)。

**Frugon** 是一款全新的本地命令行工具，旨在通过识别哪些大模型（LLM）调用可以使用更廉价的模型来处理（且不牺牲质量），从而帮助用户降低 AI Token 成本。该工具由用户 *jarodrh* 开发，通过分析本地 OpenAI 风格的日志，基于 LMArena 的质量分级提供节省成本的建议。它完全在本地运行，也可选择使用本地代理，并确保在分析过程中没有任何数据流向外部端点。该工具具备三大核心功能： 1. **分析（Analyze）：** 通过对比当前使用情况与更廉价模型的差异，估算潜在的每月成本节省额。 2. **衡量（Measure）：** 并排展示不同模型处理相同提示词（Prompt）和回复（Response）的输出结果。 3. **评估（Judge）：** 使用选定的大模型来对比候选模型与当前模型的性能，并采用倾向于“平局”的提示词模板，以确保输出结果在功能上等效。通过将成本分析与“以大模型为裁判（LLM-as-a-judge）”的验证循环相结合，Frugon 能够帮助开发者超越简单的削减成本，确保路由决策能够维持其特定任务所需的质量标准。该工具开源（MIT 协议），可通过 `uv` 安装。

超越 Git：Godot 的实时版本控制 – Lilith Duncan – GodotCon 2026 [视频] Beyond Git: Real-Time Version Control for Godot – Lilith Duncan – GodotCon 2026 [video] 3 天前

Unicode的转写规则是图灵完备的。 Unicode's transliteration rules are Turing-complete 3 天前

Nicolas Seriot 证明了 Unicode 技术标准 #35 (UTS #35) 中的音译规则（通常用于将“é”转换为“e”等简单的文本转换）是**图灵完备的**。通过利用该规范的“重访游标”（revisiting cursor）功能，这些规则可以实现复杂的计算模型，包括 2-标签系统、Collatz 函数、110 号规则元胞自动机以及素数生成算法。由于音译引擎在规范中没有限制，因此无法判定给定的规则文件是否会终止。虽然广泛使用的 ICU 库包含一个务实的“循环限制”来防止无限执行，但其底层的规则本质上是可执行代码。Seriot 的研究发现，在大多数操作系统、浏览器和数据库中被隐式信任并内置的区域设置（locale）数据文件，实际上具备执行任意计算的能力。这揭示了一个重大的安全隐患：接受来自不受信任来源的音译规则文件，等同于执行任意代码，因此应以同等的安全严谨度进行对待。

一项近期的发现指出，用于文本处理的 Unicode UTS #35 音译规则系统是图灵完备的。研究人员通过证明仅需三条重写规则即可计算考拉兹猜想（Collatz conjecture），再次揭示了一个在看似平凡的数据处理格式中出现的“意外”图灵完备性案例。 Hacker News 上的讨论阐明了几个关键点： * **安全影响：** 虽然该规则引擎在技术上是图灵完备的，但它并不构成现实的安全威胁。用户无法通过标准输入执行任意代码；该引擎需要加载自定义的、不可信的规则集，而这本身就意味着主机系统已经遭到入侵。 * **实用性：** 诸如 ICU 库（在操作系统和 .NET 等运行时中广泛使用）之类的实现，已包含重写次数限制等安全机制，以防止无限循环并确保程序能够终止。 * **更广泛的趋势：** 评论者指出，图灵完备性经常出现在配置繁杂的复杂系统中——从 Microsoft Word 的自动更正到基于字体的语言模型（LLM）。专家认为，随着数据处理规范为了应对全球语言需求而变得日益灵活，防止它们成为计算通用系统变得越来越困难，使得“可判定性”反而成了例外，而非惯例。

MIRA：基于《火箭联盟》训练的多人交互世界模型 MIRA: Multiplayer Interactive World Models Trained on Rocket League 3 天前

正在加载…

我们让 Grok 4.5、GPT-5.5 和 Claude 制作了相同的应用程序。 We made Grok 4.5, GPT-5.5, and Claude build the same apps 3 天前

本基准测试使用了三个复杂的编程挑战：3D 魔方、粒子重力沙盒以及打砖块游戏，对 Grok 4.5、GPT-5.5、Claude Opus 4.8 和 Claude Fable 5 这四款主流 AI 模型进行了评估。 **性能亮点：** * **编程能力：** Claude Opus 4.8 和 Fable 5 表现最为可靠，是仅有的两款首次尝试就完美构建出复杂 3D 魔方的模型。所有模型均成功完成了粒子沙盒和打砖块游戏的开发，其中 GPT-5.5 在视觉观感上表现最佳。 * **创意任务：** Fable 5 在 SVG 插图挑战中表现出色，兼具技术执行力与趣味性。 * **效率：** Grok 4.5 在速度和成本效益上成为明显的领跑者。其吞吐量（每秒 110 个 token）是竞争对手的两倍，且成本显著更低，使其成为应对高负载任务的“速度与价值怪兽”。 **结论：** 虽然 Claude 系列产品在复杂任务的零错误可靠性方面依然处于领先地位，但 Grok 4.5 已能有效抗衡行业顶尖模型。它在高速性能与成本效益之间取得了令人信服的平衡，证明了其在生产级编程工作负载中具备顶级竞争力。

抱歉。

远程认证 Remote Attestation 3 天前

传统安全通常对已配置的主机抱有盲目信任，使其容易受到内核、固件或供应链攻击的影响，且这些攻击在重启后依然存在。由可信平台模块（TPM）支持的远程证明通过验证主机的启动状态，为此问题提供了加密解决方案。利用 TPM，管理员可以在启动过程中对硬件、固件、内核和初始化镜像进行度量。这些度量值存储在平台配置寄存器（PCR）中，且只能进行累加扩展，确保任何篡改都会破坏信任链。通过利用 TPM 密封和“引用”（quotes）功能，企业可以确保只有当主机启动至已知且良好的状态时，才能访问加密密钥（如用于 mTLS 或根文件系统解密的密钥）。这构建了一个安全“基石”，使基础设施能够拒绝受损主机，防止其访问数据或调度工作负载。虽然实现过程较为复杂，且需要管理固件和更新策略，但远程证明将主机安全从一种信任问题转变为一种可加密验证的要求，从而迫使攻击者必须面对系统的基础完整性问题。

根据联邦贸易委员会（FTC）的和解协议，约翰迪尔（John Deere）设备的所有者将获得维修权。 John Deere owners will get the right to repair equipment under FTC settlement 3 天前

美国联邦贸易委员会与五个州已就反垄断问题与约翰迪尔（John Deere）公司达成和解。根据协议，该公司必须向农民及独立维修店提供维修其设备所需的软件和诊断工具。多年来，约翰迪尔因垄断维修服务而饱受批评。该公司此前拒绝提供关键软件，迫使客户只能依赖授权经销商进行维修。这是该公司今年达成的第二份和解协议，要求其向独立维修店和设备所有者提供维修资源，并禁止经销商针对选择非授权服务的客户进行报复。根据该协议条款（尚待司法批准），约翰迪尔将支付100万美元的执法成本，并接受为期十年的合规监管。尽管约翰迪尔此前曾辩称其做法符合竞争原则，但该公司现在声称，该协议符合其提供更灵活维修选择的承诺。这一裁决是“维修权”运动的一项重大进展，该运动旨在减少企业对农业机械和消费电子产品售后维护及服务的管控。

近期的一项联邦贸易委员会（FTC）和解协议要求约翰迪尔（John Deere）公司向农民和独立维修店提供维修设备所需的诊断工具、软件和手册。这标志着“维修权”运动取得了重大进展，该运动旨在遏制制造商通过专有软件和硬件限制阻止消费者使用其自有财产的行为。《黑客新闻》（The Hacker News）的讨论重点包括： * **“胜利”：** 尽管100万美元的罚款对这家价值数十亿美元的公司来说被普遍视为“隔靴搔痒”，但强制要求共享诊断数据的规定被视为反对反竞争行为的一项实质性胜利。 * **实施担忧：** 批评人士认为，该和解协议可能并非万灵药。他们担心约翰迪尔仍会通过高额订阅费、专有零部件以及对独立维修店而言极其昂贵的“特定任务”工具来建立“护城河”。 * **文化背景：** 争论的核心在于现代复杂的排放法规约束下的机械与农民偏好的老式简易设备之间的矛盾。维修权的支持者认为，制造商以环保法规为“替罪羊”来实施基于软件的垄断，而另一些人则强调了系统性集中环境管控的必要性。

我和那些行善的仙人掌走私客的公路旅行 My road trip with the do-gooding cactus smugglers 3 天前

请启用 JavaScript 和 Cookie 以继续。

抱歉。

每日HackerNews RSS