每日HackerNews RSS

## Meta Segment Anything Model 3 (SAM 3) 摘要 Meta 发布了 Segment Anything Model 3 (SAM 3),这是图像和视频理解方面的一项重大进展。这个统一的模型擅长使用文本、示例或视觉提示来检测、分割和跟踪对象,提供了前所未有的灵活性。除了 SAM 3,他们还推出了 **SAM 3D**,用于从单张图像重建 3D 对象和人体,以及 **Segment Anything Playground**,一个用户友好的平台,用于试验这些 AI 功能。 主要功能包括改进了文本和图像提示的性能,以及一个新的基准数据集 **SA-Co**,用于评估概念分割。SAM 3 已经为 Meta 产品中的功能提供支持,例如 **Facebook Marketplace 的“在房间中查看”**,并将很快增强 **Instagram 的 Edits、Vibes 和 meta.ai** 中的创作工具。 此外,SAM 3 正在通过与 **Conservation X Labs 和 Osa Conservation** 的合作,帮助科学研究,提供用于野生动物监测的数据集。Meta 强调开放科学,发布模型权重、代码,并鼓励社区贡献以进一步完善和扩展这些强大的 AI 工具。

最近的 Hacker News 讨论强调了 Meta 的 Segment Anything Model (SAM) 的潜力。一位用户用一张五条腿的狗的图片测试了多模态大型语言模型 (LLMs),发现它们总是将腿的数量数错为四条。然而,SAM 在被提示后*能够*准确地分割出所有五条腿。 这表明 Meta 正在采用一种独特的图像处理方法,超越了典型的 LLM 能力,尤其是在视觉数据理解方面——这是许多 LLM 目前的弱点。 另一位用户指出,像 YOLO 这样的分割工具可能也能实现类似的结果,但该测试表明 SAM 的底层技术可能是朝着更具视觉能力和更强大的未来 LLM 的重要一步。 原始讨论链接到 Hacker News 上之前关于同一主题的帖子。

将此建议添加到可以作为一个提交应用的一批建议中。此建议无效,因为未对代码进行任何更改。在拉取请求关闭时无法应用建议。在查看部分更改时无法应用建议。每行只能应用一个建议到一批中。将此建议添加到可以作为一个提交应用的一批建议中。不支持对已删除行应用建议。您必须更改此行中的现有代码才能创建有效的建议。此建议已被应用或标记为已解决。无法从待处理的评审中应用建议。无法对多行注释应用建议。无法在拉取请求排队合并时应用建议。现在无法应用建议。请稍后重试。您现在无法执行此操作。

## AI 生成代码在 OCaml 项目中引发争论 最近提交给 OCaml 编译器的补丁在 Hacker News 上引发了关于在开源项目中使用 AI 生成代码的激烈讨论。作者提交了一个借助 LLM 实现的大型功能,承认他们并不完全理解代码,也未质疑 AI 指定的作者身份。 回应大多是批评性的。担忧集中在责任归属(当作者无法解释代码时,谁来修复错误?)、技术债务增加、潜在的版权问题以及维护者审查潜在缺陷 AI 输出的负担上。一些人认为,接受此类贡献会破坏开源协作的精神。 然而,也有人承认 AI 辅助的潜在好处,尤其是在维护者有限的项目中。这场争论凸显了制定关于 AI 生成贡献的新指南和政策的必要性,重点关注代码质量、测试和可维护性,而不是代码的*创建方式*。最终,这场讨论强调了利用 AI 能力与维护开源开发的完整性和可持续性之间的紧张关系。

## 西兰花人 重制版:AI 创作 受启发于 2010 年在谷歌内部流传的一段广受欢迎的视频,“西兰花人”最近由一位开发者使用前沿 AI 工具——Veo 3.1 和 Nano Banana——在一天之内重制。该项目的目标是捕捉原视频的精神,它以幽默的方式展现了谷歌软件开发的 frustrations。 该过程包括编写剧本、使用 AI 生成视觉效果,以及使用 CapCut 进行大量的后期制作编辑。Nano Banana 用于创建原始角色和背景的逼真版本,而 Veo 生成了视频片段。尽管存在时长限制、角色一致性以及实现所需情感表达(“EMOTE!”)等挑战,但 AI 工具证明了其令人惊讶的能力,尤其是在保持视觉一致性方面。 创作者强调了该过程的迭代性,需要多次拍摄和提示调整。虽然承认结果并非“电影”,但该项目展示了 AI 增强创造力的力量,并使传统电影制作方法难以实现的个人项目成为可能。最终,这次重制成功地唤起了怀旧之情,并将“西兰花人”介绍给了一代新的谷歌员工。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 西兰花人,重制版 (mbleigh.dev) 4 点 由 mbleigh 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 使用针状数组创建实心针织形状 (acm.org) 9 分,PaulHoule 发表于 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 愚蠢的死亡方式:印刷品 (ilovetypography.com) 3 分,由 jjgreen 2小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

1951年至1992年,美国在内华达试验场进行了928次原子弹试验,其中100次为大气爆炸。这些试验出人意料地是公开事件,能见度达数百英里——甚至远至洛杉矶,爆炸光芒照亮夜空,报纸上还轻松地报道,配以“洛杉矶昨天出现了两次黎明”之类的标题。 照片记录了这一奇观,经常记录每次爆炸力量的增加。人们对核武器表现出一种病态的迷恋,1952年的一次试验甚至在当地电视上直播,收视率出乎意料地高。回过头来看,这种接受度令人不安,就像不知不觉地接触危险物质。 拉斯维加斯积极利用这些事件,宣传爆炸时间,并提供“原子鸡尾酒”和观看派对。这些试验吸引了渴望目睹蘑菇云的游客,凸显了一个奇怪的文化时刻,即原子弹的恐怖力量被当作一场奇观来对待。

一个黑客新闻的讨论围绕着amusingplanet.com的链接,展示了从洛杉矶看到的原子测试照片。 这篇帖子引发了关于当时奇特的文化反应的对话——企业积极*营销*爆炸的景象,并举办“原子鸡尾酒”派对。 用户指出,即使在如此远的距离,内华达州的测试也能看到明显的光闪,引发了人们对更大爆炸会是什么样子的猜测。 一位评论员质疑照片的真实性,认为通过长曝光摄影可以实现类似的效果。 有人提出了一点关于文章标题的语法问题(“How the Atomic Tests Looked Like...”),认为这是非英语母语人士常见的表达方式。 总的来说,这个帖子反映了历史迷恋和技术讨论的结合。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 重新思考 C++:架构、概念和责任 (embarcadero.com) 5 分,来自 timeoperator 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 放弃Netflix,拥抱理性消费 作者取消了Netflix订阅 (€19.99/月),原因是使用频率低且体验不佳,转而将这笔钱重新分配到积极提升生活品质的工具上。 他们现在订阅了Zed Pro (€10/月) – 一个代码编辑器,鼓励他们更频繁、更愉快地进行编程。Kagi搜索引擎订阅 (€5/月) 提供了无广告、尊重隐私的搜索体验,直接支持他们所重视的服务。最后,一台小型Hetzner服务器 (€4/月) 提供了个人互联网空间,用于学习和托管他们的博客。 核心要点并非 *选择了哪些* 服务,而是 *这笔钱* 被重新投资到能够提供直接价值并鼓励主动参与的爱好和工具中,而不是被动消费。这种转变优先考虑了目的性、技能建设以及支持与个人价值观相符的产品——这是一种比默认选择标准流媒体服务更令人满足的选择。

一场由一篇质疑 Netflix 订阅价值的链接引发的 Hacker News 讨论,揭示了订阅疲劳和更注重消费的趋势。 用户正在积极减少对 Disney+、Paramount+ 和 HBO Max 等流媒体服务的订阅,转而选择 Netflix 和 YouTube Premium,并根据需要购买或租赁内容。这种转变鼓励更谨慎的观看选择。 一些人甚至考虑放弃音乐流媒体,转而购买专辑,理由是担心其对独立艺术家的负面影响。这场对话凸显了对订阅模式的更广泛重新评估,人们意识到自己一直在为很少使用的服务付费,并寻求更周全地消费媒体和支持创作者的方式。一位用户甚至利用 Netflix 学习语言,展示了其意想不到的价值。

## 对Linux长久的热爱 尽管作者偏爱BSD和illumos,但仍反思着对GNU/Linux的深厚而持久的喜爱——这个操作系统点燃了作者对类Unix系统终生的热情。从1996年开始,Linux提供了一个解放性的“白板”和命令行力量,培养了理解和贡献于其发展的愿望。 作者积极参与早期的Linux社区,倡导正确认识GNU的作用,并见证了它的惊人扩张——从一个小众兴趣发展到驱动智能手机、汽车和无数设备。虽然承认Linux开发的近期变化,特别是远离Unix原则,如极简主义和跨兼容性,以及对企业影响力的担忧,但作者仍然心存感激。 Linux提供了宝贵的学习经验、职业机会,以及沉浸在开源技术中的生活基础。尽管目前存在一些挫折,但其广泛的成功、持续的功能以及大量创新的发行版确保Linux将继续在作者的未来中占据重要地位。

一篇名为“为什么我(仍然)热爱Linux”的博文引发了Hacker News的讨论,揭示了人们对该操作系统的细致看法。用户普遍认为Linux依然强大,甚至相对于Windows有所改进,但也有一些人表达了保留意见。 一个关键的争论点是systemd,一位评论员承认它为Debian带来了一致性,但怀念旧的Unix理念,即小巧、可组合且文档完善的组件。这位用户认为systemd引入了更多复杂性和意想不到的副作用。 另一位用户质疑btrfs长期以来不可靠的声誉,询问它现在是否可以与xfs或ext4等文件系统相提并论。总的来说,这场对话突出了人们对Linux持续的喜爱,但同时也伴随着对现代发展的担忧以及对稳定性的持续疑问。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 最稳定的树莓派? 81% 更好的 NTP 与热管理 (austinsnerdythings.com) 11 分,由 todsacerdoti 发表于 53 分钟前 | 隐藏 | 过去的 | 收藏 | 3 条评论 irjustin 1 分钟前 | 下一个 [–] 我喜欢这个。单纯追求完美。回复 geerlingguy 16 分钟前 | 上一个 | 下一个 [–] 这是一个 SBC 级别的 OCXO。我半想知道,增加更大的散热器,或者甚至在现有振荡器周围放置热量,是否也能帮助,或者加热是否更集中在 PCB 本身。 在做像设置 NTP 服务器这样“简单”的事情时,总是能学到新的东西!回复 ACCount37 17 分钟前 | 上一个 [–] 这是老牌的 OCXO - 恒温晶体振荡器。但加热元件是 CPU。太搞笑了。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com