每日HackerNews RSS

## 凯桥坍塌:NTSB报告摘要 国家运输安全委员会(NTSB)确定,一根松动的电线是导致2024年3月巴尔的摩弗朗西斯·斯科特·凯桥坍塌的原因。这根电线由于电线标签带固定不当,引发了电力中断,导致984英尺长的*Dali*号集装船在接近大桥时失去了动力和转向能力。 尽管船员试图恢复控制,*Dali*号仍与17号桥墩相撞,导致大桥的大部分结构坠入河中,不幸造成六名公路工人死亡。NTSB强调了这起事故的可预防性,并赞扬了引航员和相关部门迅速采取行动,从而限制了进一步的伤亡。 调查还揭示了一个关键的脆弱性:1977年建造的凯桥缺乏足够的保护措施,以抵御日益大型船舶的撞击——*Dali*号的尺寸远大于1980年撞击大桥并仅造成轻微损坏的船只。NTSB向包括海岸警卫队和全国桥梁所有者在内的多个组织发出了多项安全建议,敦促他们进行桥梁脆弱性评估并采取预防措施,以避免类似灾难的发生。

## 弗朗西斯·斯科特·基桥倒塌事件摘要 最近巴尔的摩弗朗西斯·斯科特·基桥倒塌是由一根松动的电线引发的,但源于一系列系统性故障,而非单一原因。虽然一个故障的电气连接引发了停电,但调查显示船舶的设计、维护和操作程序存在关键缺陷。 主要问题包括手动而非自动的变压器切换、缺乏关于切换程序的常规培训、单一且非冗余的燃油泵为发电机供油,以及自动发动机关闭而非利用紧急系统。NTSB报告强调了一种“瑞士奶酪模型”的故障,即多个安全措施同时失效。 进一步的担忧包括船舶依赖冲洗泵为发电机供油,绕过标准冗余,以及船舶“黑匣子”数据记录器的问题。专家强调“深度防御”和主动安全措施的重要性,而不仅仅关注单个组件的故障。该事件凸显了航运业中一个更广泛的问题,即优先考虑成本削减而非健全的安全协议和充分的船员培训。桥梁重建估计成本超过50亿美元。

自动化测试发现了一个令人惊讶的问题:在Postgres、DuckDB和SQL Server等系统中,混合使用整数和浮点数时,传递性比较(a=b,a=c 并不*总是*意味着 b=c)存在问题。这源于这些系统处理类型提升的方式——在比较过程中将整数转换为双精度浮点数。双精度浮点数具有有限的精度,在表示大整数时会导致信息丢失,从而导致比较不准确。 这种不准确性会影响查询优化,并且关键地影响依赖类型提升的连接操作。为了解决这个问题,作者实现了一个自定义比较函数 (`cmpDoubleInt64`),该函数通过将两个值都转换为双精度浮点数*并*转换回整数,来显式检查精度损失,并考虑潜在的四舍五入。 值得注意的是,Python和SQLite可以正确处理这些比较。然而,测试的大多数其他数据库和编程语言都表现出相同的精度问题,这凸显了标准库功能中的差距。提供的代码为面临此问题的开发人员提供了一个解决方案。

Anthropic致力于训练Claude保持政治上的公正,旨在提供无偏见的回复,以同等的深度和质量对待所有观点。他们开发了一种自动评估方法,使用“配对提示”——从相反的角度呈现相同主题——来评估这一点。 测试了六个模型,包括他们自己的Claude Sonnet 4.5和Opus 4.1,以及GPT-5、Gemini 2.5 Pro、Grok 4和Llama 4,评估的重点是公正性、对 opposing 观点的承认以及拒绝参与。Claude Sonnet 4.5 的表现与Grok 4和Gemini 2.5 Pro相似,优于GPT-5,并且显著优于Llama 4。 为了实现这一目标,Anthropic利用系统提示和“角色训练”——强化客观性和尊重参与等特质。他们正在开源他们的评估方法,以促进整个行业对衡量和减轻人工智能政治偏见的标准,他们相信共同的标准将建立信任并使所有政治光谱的用户受益。虽然承认他们当前方法的局限性,但他们致力于在这个关键领域进行持续的研究和改进。

## 克劳德政治偏见的衡量:黑客新闻摘要 黑客新闻讨论集中在Anthropic努力创建政治上“持平”的聊天机器人克劳德。用户对这种方法表示怀疑,认为它优先考虑避免冒犯而非事实准确性,并可能强化现有的偏见。 提出的担忧包括:克劳德的训练数据(受Reddit等来源的强烈影响)、它倾向于向“中间立场”调整,即使在一方观点明显错误的情况下,以及它以美国为中心的视角。 许多评论员指出,定义真正的“中心”是存在问题的,并且追求中立可能会扼杀批判性思维。 一些用户分享了展示克劳德偏见的实验,而另一些人则指出,鉴于互联网本身就具有固有偏见,实现中立是困难的。一个关键点是,虽然克劳德旨在呈现平衡的论点,但它难以处理边缘或明显虚假的说法,有时会不公平地驳斥它们。 最终,讨论的问题是,追求“持平”是否是一个有价值的目标,或者克劳德是否应该专注于提供准确的预测并避免主动发表意见,将价值判断留给用户。

Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.

## Meta Segment Anything Model 3 (SAM3) 摘要 Meta 的新型 Segment Anything Model 3 (SAM3) 在计算机视觉领域引起了广泛关注。初步印象表明,它取得了显著的进步,尤其是在“零样本”文本提示检测方面,超越了 Gemini 和 Qwen 等先前模型。用户报告其效果几乎与在 10,000 张标注图像上训练的模型相当,可能节省大量的标注工作。 除了图像分割,SAM3 还包含一个 3D 网格生成器,能够有效处理遮挡,但目前导出网格需要工具将生成的 Gaussian splats 转换为其他格式。该模型是开放权重,允许自托管。 许多评论员强调 SAM3 在自动化数据准备、快速原型设计以及提炼成更小的实时模型方面的潜力。Roboflow 正在将其 SAM3 集成到其流程中,并推出名为 Rapid 的新产品。虽然它在特定任务(如电路板追踪)方面存在困难,但在识别儿童绘画中的物体等领域表现出色。人们仍然担心实时视频处理,但流媒体支持的改进解决了一些问题。该许可允许商业用途,但不包括军事应用和受限制的出口。

请求失败。Incapsula 事件 ID: 1556000470173606636-31401055758846917

## 布雷顿森林体系III:摘要 佐尔坦·波扎尔提出的“布雷顿森林体系III”论点,源于2022年乌克兰危机,认为全球货币体系正在经历根本性转变。他认为,正在从以美元为基础的体系(布雷顿森林体系II——以美国国债为支撑的美元)转向越来越依赖大宗商品和黄金(“外部货币”)的体系,原因是美元资产被没收的风险已经显现。 波扎尔在佩里·梅尔林“货币观”的基础上(货币有四种价格:平价、利率、汇率和物价水平),强调了金融市场的“管道”——资金*实际*流动的运作方式。他将这一观点延伸到大宗商品市场的“现实领域”,揭示了平行的基础设施和压力。例如,重新路由俄罗斯石油等中断事件,需要更多的船只、时间和关键的*融资*,这会给银行资产负债表带来压力,并可能在量化紧缩期间加剧问题。 一个关键的脆弱性在于,非美国银行持有大量美元资产,但无法获得美元的最后贷款人支持,这导致它们依赖美联储的掉期额度。这一框架解释了最近出现的利率平价悖论,并表明各国正在寻求替代美元主导地位的资产,对不受地缘政治风险影响的资产——大宗商品——的偏好日益增加。最终,波扎尔的研究强调了金融与物理现实的相互联系,以及货币政策在应对大宗商品驱动冲击方面的局限性。

## 人工智能:炒作、泡沫与权力争夺 作者浸淫人工智能三年后得出结论,它是一种有用的但被严重夸大的技术,可能正走向灾难性的泡沫破裂。虽然小规模应用显示出潜力——例如信息整合——但试图广泛自动化工作流程或取代整个职能往往代价高昂且无效。作者是一位设计师,同时也是一家依赖人工智能的企业联合创始人,他指出人工智能在复制现有创意作品方面存在困难,并且在设计和用户界面等领域,其效率始终不如人类专业人士。 核心问题不在于人工智能的潜力,而是由对通用人工智能(AGI)的追求所驱动的不可持续的财务投资。顶尖公司投入巨资,形成了一个相互依赖的系统,缺乏可行的盈利模式,这与互联网泡沫如出一辙。 除了财务风险外,作者还对人工智能对真相和社会信任的影响表示担忧,这种担忧因其生成令人信服的虚假信息的能力而加剧。然而,更深层次的担忧是,人工智能的炒作掩盖了通过大规模数据中心建设来整合土地、能源和水资源——从而有效地创建由私营部门拥有、基础设施丰富的实体,并拥有巨大的政治权力,甚至可能超越民主治理。这种“私有化”代表了一种根本性的权力转移,无论人工智能是否能实现其宏伟的承诺。

现在由高通公司拥有的Arduino,对其服务条款和隐私政策进行了重大且有争议的修改,引发了人们对其开源根源的担忧。新政策赋予Arduino对用户上传内容的永久许可,允许广泛监控AI功能的使用情况,并禁止对平台进行逆向工程——这对用户群体来说是一个核心原则。 关键的是,用户数据,包括未成年人的数据,现在被整合到高通的数据生态系统中,即使在帐户删除后,用户名也会保留多年。这些变化有效地将Arduino从一个社区驱动的平台转变为一个更加可控、提取数据的公司服务。 修改的时间与对高通商业行为的审查同时发生,包括涉及前高管的欺诈案件,以及关于该公司庞大私人飞机机队的问题,尽管Arduino获得了大量资金。透明度和数据权利倡导者正在敦促用户查看更新后的政策。

澳大利亚的“Triple Zero”(000)紧急呼叫系统出现了一个严重缺陷,可能危及数千人。最近的事件,包括悉尼的一起死亡案例,显示,较旧的三星智能手机可能无法连接到紧急服务,尤其是在依赖沃达丰网络时。 问题源于全国范围内的3G网络关闭。虽然许多手机已过渡到4G/5G,但有些手机缺乏完整的VoLTE(Voice-over-LTE)功能——在这些网络上进行语音通话所必需的——或者在“漫游”到不同运营商以获取信号时存在兼容性问题。这意味着如果主网络不可用,这些手机无法可靠地切换到另一个网络拨打紧急电话。 Telstra的测试证实了某些三星型号的故障,三星已发布受影响设备清单,需要更新或更换。澳大利亚运营商正在通知用户,并将禁止不合规手机接入其网络。这并非澳大利亚独有的问题;欧洲也发现了类似的VoLTE互操作性问题,凸显了4G/5G语音通话技术缺乏全球标准化。

每次你让ChatGPT编写复杂的逻辑、制定计划或做一些创造性的事情,你都在做一件事:外包摩擦。而摩擦正是技能建立的地方。我们正在训练大脑相信:如果我无法立即找到答案,机器会替我找到。这不仅仅是关于效率,而是关于功能上的依赖。一旦我们失去对LLM的访问,我们就会变得像一无所知的3岁孩子一样。我可能错了,我会写另一篇关于通过人工智能加速学习的文章。

更多

联系我们 contact @ memedata.com