每日HackerNews RSS

请启用 JavaScript 并禁用任何广告拦截器。

## Character.AI 将屏蔽未成年用户 Character.AI 宣布将禁止 18 岁以下用户使用,并采用技术检测年龄,依据对话、互动和关联社交媒体。此举源于对人工智能辅助的有害互动和潜在法律责任的担忧。 Hacker News 上的讨论显示,人们对检测方法的有效性表示怀疑,许多人认为精通技术的孩子可以绕过限制。一些人认为,此举主要是为了法律保护,而非真正的安全问题,并指出谷歌对 Character.AI 的收购是一个因素。 强制性身份验证等替代方案正在讨论中,但存在隐私方面的担忧。另一些人建议关注家长责任,或采取基于成熟度而非年龄的更细致的方法。一个关键点是可能出现误报,以及准确评估在线行为的困难。 许多评论员强调了在互联网上平衡匿名性和安全性的更广泛问题。

## Relace Apply 3:开源一款快速且准确的代码合并模型 在发布最初的Fast Apply模型一年后,Relace正在开源**Relace Apply 3**背后的经验,该模型在代码合并方面实现了**每秒10k+ tokens**的性能,并具有最先进的准确性。解决的核心问题是使用大型语言模型重新生成整个代码库以进行小幅修改效率低下——这是一个代价高昂且缓慢的过程。 Relace的解决方案采用“diff & apply”方法:前沿模型生成最小的代码更改(diff),而一个更小、更专业的“apply模型”有效地合并这些更改。他们发现高质量、多样化的数据集(约14.5万个示例)至关重要,优先考虑质量而非单纯的大小。该数据集是通过与prompt-to-app公司合作来捕捉真实世界的合并场景创建的,然后使用LLM作为裁判进行可扩展的质量控制。 训练利用了开源模型上的**LoRA**(参数量为3-8B)和**FP8量化**以提高速度。**推测解码**进一步提升了推理速度,利用了代码合并的可预测性。Relace Apply 3在准确性方面超越了之前的模型,尤其是在复杂的编辑方面,并支持256k上下文窗口。这项工作展示了专门的小模型在目标数据上进行训练的强大力量,Relace正在将这种策略扩展到其他编码任务。他们正在积极招聘以继续这项研究。

Relace.ai 实现了每秒 10,000 个 token 的处理速度,这得益于其“快速应用”模型,该模型旨在快速应用对大型语言模型生成的代码的编辑。他们成功的关键在于构建了一个内部评估工具——一种 Git 样式的差异查看器,用于分类合并结果并保持质量。 与类似的 MorphLLM 模型相比,Relace.ai 的方法优先考虑速度而非对代码进行广泛的“平滑处理”。虽然平滑处理可以修复简单的错误,但会增加引入更复杂、破坏性幻觉(不正确的代码更改)的风险。MorphLLM 的较慢、较大的模型似乎平滑处理得更激进,而其较快版本则表现出奇怪的错误,这可能是由于激进的量化造成的。 讨论还涉及定价问题,Relace.ai 为大批量用户提供折扣,并寻求对成本可行性的反馈。最终,Relace.ai 专注于在代码应用中实现速度和准确性之间的平衡。

一段视频显示,一名边境巡逻局特工在芝加哥质问两名骑自行车的年轻男子,要求出示身份证明。当其中一名男孩表示他没有身份证,但出生在美国时,该特工向同事要求进行“面部扫描”。 另一名警员随后用手机扫描该男孩的面部,在核实姓名后将其与数据库进行比对。视频在此处结束。 这起事件引发了人们对边境巡逻局(CBP)在美国境内使用面部识别技术的担忧,尤其是在针对公民方面。发布这段视频的记者正在寻求更多关于CBP使用“移动堡垒”的信息和相关录像,这可能是一种用于此类扫描的系统。他们正在通过安全消息渠道征集现任或前任机构员工的线索。

启用 JavaScript 和 Cookie 以继续。

## AOL 以 15 亿美元出售给 Bending Spoons AOL 已被 Bending Spoons 以 15 亿美元收购,引发了对后者公司业绩记录的担忧。Bending Spoons 以收购陷入困境的技术品牌而闻名,例如 Evernote、Meetup 和 Vimeo,通常会实施削减成本的措施,包括裁员和提价。 讨论的中心是 Bending Spoons 旨在复兴 AOL,还是仅仅从其剩余用户群中提取价值,特别是其年长的用户群体。尽管 AOL 已不再是昔日的辉煌,但它仍然产生可观的现金流。一些人推测,此次收购是为了利用 AOL 的用户数据或既定的品牌认知度。 Bending Spoons 的做法受到了褒贬不一的评价,一些人赞扬了其对 Evernote 等收购产品的改进,而另一些人则批评他们过于关注盈利能力而忽视了用户体验。此次收购引发了人们对 AOL 服务未来以及在新的所有权下可能进一步变化的质疑。

加载中...

## 稳健统计:一种新的研究与文本分析方法 一位贝叶斯统计学家开发了一种工具,**稳健统计 (sturdystatistics.com)**,用于深入研究和文献综述,超越了传统的LLM方法。该工具利用分层贝叶斯混合模型(受基因组学启发)来组织和可视化文本数据,提供了一个透明且可定制的大型语言模型替代方案。 与LLM不同,它能够快速在小型数据集上进行训练,创建自定义分类法并能够探索引用网络,并配备了专门的“深度挖掘”功能。最初是为学术研究而构建的,现在它支持Hacker News、Google搜索结果和收益记录。 底层模型类似于LDA,但使用Pitman-Yor过程,擅长捕捉复杂的数据结构。它基于自定义的C语言Gibbs采样器,具有Python接口和DuckDB,用于快速查询。该创建者提供了一个API和一个免费使用的网站,并寻求Hacker News社区的反馈。一个演示关于AI幻觉的文献综述的视频可在此处观看:[https://www.youtube.com/watch?v=OUmDPAcK6Ns](https://www.youtube.com/watch?v=OUmDPAcK6Ns)。

## Upwave:面向现代营销人员的品牌衡量 Upwave是一家快速发展且盈利的公司,正在彻底改变主要广告商和代理商的品牌衡量方式。他们的人工智能驱动平台提供基于科学依据的洞察,深入了解所有主要渠道(CTV、数字媒体、社交媒体等)的漏斗顶端营销活动效果,帮助营销人员最大化品牌支出。 公司正在寻找一位**高级软件工程师**来构建和扩展支持该平台的后端系统。这个全栈角色,侧重后端,涉及开发API、处理数十亿广告展示的数据管道,以及集成人工智能(如LLM)以向客户提供可操作的洞察。 理想的候选人拥有5年以上经验,对云基础设施(AWS、Kubernetes)有深入了解,并且精通Python、Java/Kotlin等语言以及现代前端框架(React)。他们重视简洁的代码、可靠性和协作,并且能够熟练操作他们构建的系统。 Upwave提供远程优先、以工程为中心的企业文化,拥有现代技术栈、对数百万美元广告决策的重大影响,以及对工作生活平衡的承诺。(薪资范围:15万美元 - 17.5万美元 + 奖金 + 股权)。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Upwave (YC S12) 正在招聘软件工程师 (upwave.com) 1天前 | 隐藏 考虑申请YC 2026冬季项目!申请截止日期为11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

一位我们最近遇到的牙科保健师告诉我们应该先用牙线,再刷牙,而不是反过来。我的第一反应是“不可能”。我以为我的口腔卫生习惯已经很完美了。结果她是对的。先用牙线可以松动并清除牙齿之间的食物残渣和牙菌斑,而牙刷无法触及。一旦牙齿之间的缝隙清洁干净,牙膏中的氟化物就能覆盖更多表面,更好地保护牙齿。这个逻辑说得通。而且研究也证实了这一点(比如这项研究)。三个要点——(1)令人惊讶的是,你可以每天做某件事很多年,然后才意识到有更好的方法。(2)用牙线比担心顺序更重要。所以首先要养成用牙线的习惯。(3)并且假设你已经养成了习惯,先用牙线再刷牙。

## 牙线与刷牙顺序的争论 一篇名为“先用牙线再刷牙”的博客文章引发了 Hacker News 的讨论,核心围绕着口腔卫生的最佳顺序。 许多人认为早餐前刷牙是理所当然的,但文章强调研究表明先用牙线再刷牙更有效。 核心论点是牙线可以清除颗粒,而先刷牙可能会清除那些松动的碎屑。 然而,争论仍在继续,一些人认为先刷牙可以清除较大的颗粒,从而使牙线更容易使用。 也有人担心漱口水会抵消牙膏中的氟化物益处,以及正确的刷牙技巧的重要性(例如改良式巴氏刷牙法)。 讨论还涉及牙线效果本身,据称一些牙医淡化了牙线的必要性,以及对口腔微生物组健康的各种观点。 最终,该讨论强调了质疑普遍观念的价值,即使是在看似简单的日常生活中,并强调了支持不同方法的科学研究。

## Tailscale 对等中继:提升性能与控制 Tailscale 对等中继是一种新的、客户管理的流量中继选项,旨在显著提高连接速度和可靠性,尤其是在具有挑战性的网络环境中,例如锁定的云基础设施或严格防火墙后。与 Tailscale 托管的 DERP 中继不同,对等中继提供接近直接连接的吞吐量——通常快数倍——因为它们由用户部署和控制。 此功能解决了客户对 DERP 性能限制和管理自定义 DERP 集群的复杂性的反馈。对等中继直接内置于 Tailscale 客户端中,只需配置一个 UDP 端口即可简化部署。 Tailscale 仍然优先考虑直接连接,并在需要时回退到对等中继,然后是 DERP,同时始终保持端到端 WireGuard 加密。它们非常适合需要可预测访问路径、卸载 DERP 流量以及通过云 NAT 和防火墙实现高吞吐量连接的场景。 目前处于公开测试阶段,适用于所有计划(提供两个免费中继),Tailscale 对等中继为客户提供了更大的控制权和灵活性,以便在任何网络上扩展 Tailscale。

## Tailscale 对等中继:摘要 Tailscale 引入了“对等中继”,允许用户指定自己的设备作为 Tailnet 中流量的中继,作为 Tailscale 的 DERP 服务器的替代方案。当由于 NAT 或防火墙导致设备之间无法直接连接,或者 DERP 服务器提供较慢的速度时,此功能特别有用。 主要好处是提高性能和控制力——用户可以利用自己的带宽并可能减少对 Tailscale 基础设施的依赖。虽然两个中继是免费的,但扩展到超出该数量需要联系 Tailscale。 讨论强调了与现有解决方案(如 tinc 和 Nebula)的比较,一些人指出 tinc 长期以来具有中继功能,而 Nebula 具有更高级的功能。人们对 iOS/tvOS 支持表示担忧,原因是应用程序大小限制,以及可能需要在防火墙上打开 UDP 端口。用户还讨论了站点到站点连接的场景以及自托管的好处,以提高可靠性和性能,尤其是在处理 NAT 问题时。最后,关于额外中继的定价模式存在一些争论。

## Oracle 终于添加原生布尔支持 Oracle 最近的 23ai 版本引入了原生布尔数据类型,这一功能在 PostgreSQL 等其他数据库中早已可用(超过二十年)。 之前,Oracle 开发者通过使用 VARCHAR2 或 NUMBER 列来表示真/假值(例如 ‘Y’/’N’,1/0)来解决这一限制。 虽然这些解决方法可行,但由于冗余转换和更大的索引大小而影响了性能。 PostgreSQL 将布尔值高效地存储为单个字节,并允许直接进行逻辑运算,从而简化查询并加快过滤速度——尤其有利于分析型工作负载。 文章重点介绍了 Oracle(23ai 之前)和 PostgreSQL 之间的表结构以及插入/选择语句的差异,展示了原生布尔类型所实现的更简洁、更高效的逻辑。 最终,与模拟布尔值相比,使用 BOOLEAN 提供了更高的存储效率、类型安全性、查询简洁性和可读性。 HexaCluster 提供了一个迁移工具 HexaRocket,可以在数据库迁移期间自动将 Oracle 的 CHAR(1) 和 NUMBER(1) 列映射到 PostgreSQL 的 BOOLEAN 类型。

## Hacker News 上关于 Oracle 与 PostgreSQL 的讨论 一篇报道指出 Oracle 在其 23ai 数据库中采用了 BOOLEAN(PostgreSQL 早已拥有),由此在 Hacker News 上引发了一场讨论,并迅速演变成关于 Oracle 与 PostgreSQL 和 MySQL 等开源替代方案优缺点的更广泛辩论。 一些评论员批评了 Oracle 的命名规范,并认为原始帖子是数据库迁移服务的广告。讨论的核心集中在大型企业为何即使成本高昂仍坚持使用 Oracle,原因包括强大的支持、根深蒂固的惯性以及开源数据库难以复制的专业功能。 虽然许多人承认 PostgreSQL 的改进,但一些人认为它在某些方面仍然落后于 Oracle/MSSQL,尤其是在全局临时表和强大的行级别安全性等功能方面。另一些人则指出迁移风险、兼容性问题以及员工再培训成本等实际问题是切换的障碍。尽管对 Oracle 的公司文化和定价存在批评,但许多人认为该数据库本身是一个可靠的产品,将其比作企业领域的 Apple。

更多

联系我们 contact @ memedata.com