每日HackerNews RSS

## PostgreSQL 中的 CTE:超越可读性 CTE(Common Table Expressions,公共表表达式)是一种流行的 SQL 功能,通常用于查询组织,但其性能影响已经演变。最初,CTE 充当“优化屏障”,强制对结果进行物化——完全计算和存储,阻止查询计划器跨 CTE 进行优化。这意味着失去了使用索引和谓词下推的机会。 PostgreSQL 12 通过 CTE 内联改变了这一点,现在计划器可以将 CTE 视为子查询,应用正常的优化。但是,当存在多次引用、递归查询、数据修改操作或使用 `VOLATILE` 函数时,仍然会发生物化。PostgreSQL 17 通过统计信息传播改进了物化 CTE,提高了规划准确性。PostgreSQL 18 提供了物化期间内存/磁盘使用情况的可视性。 虽然 CTE 提供了可读性,但请注意其行为。对于单次使用、简单的 CTE,内联是理想的。对于具有小结果的多次引用,物化是可以接受的。大型中间结果受益于具有索引和统计信息的临时表。数据修改和递归需要 CTE,但要了解其局限性。 最终,理解 PostgreSQL *如何* 处理 CTE 对于编写高效查询至关重要,超越“先做这个,再做那个”的命令式风格,让计划器有效地进行优化。

## Hacker News 讨论:好的 CTE,坏的 CTE (boringsql.com) Hacker News 上一篇帖子引发了关于 SQL 中通用表表达式 (CTE) 的讨论。CTE 使用 `WITH` 子句定义,是用于提高查询可读性和结构的临时命名结果集。最初的帖子没有定义 CTE,促使评论者指出这一点。 对话很快扩展到 CTE 使用的各个方面。用户分享了在不同数据库系统(PostgreSQL、Oracle、SQL Server、DuckDB)中使用 CTE 的经验,并强调了性能方面的考虑。主要收获包括:CTE 主要用于代码组织,不一定用于优化(尽管某些系统会将其内联);递归 CTE 并非真正的递归;有时将 CTE 分割成临时表可以提高性能,尤其是在分析查询中。 一些评论员赞扬了原文的详尽性,特别是其对递归 CTE 的解释以及 CTE 中聚合的潜在陷阱。其他人讨论了使用 Claude 等 AI 工具重写低效 SQL 查询,从而显著降低计算成本。讨论还涉及理解与 CTE 相关的数据库特定优化和功能的重要性。

RamAIn是一家获得Y Combinator支持的初创公司,正在构建AI智能体来自动化重复的企业工作流程——以比人类快10倍且更可靠的速度运行遗留系统和应用程序。公司由前麦肯锡顾问Shourya Vir Jain和AI研究员Vansh Ramani(曾就职于CMU和Meta)创立,RamAIn将前沿研究与实用、可投入生产的系统相结合。 他们目前正在招聘创始AI/ML研究员,以开发能够进行复杂推理、规划和执行的智能体。该职位侧重于构建多模态模型以理解软件界面,并创建强大的动作选择系统。 这不仅仅是一个纯粹的研究职位;理想的候选人将快速原型设计、实验和部署模型,以自动化企业客户的实际任务。RamAIn寻找在智能体系统、机器学习或相关领域具有丰富实践经验,并对推动AI原生自动化的边界充满热情的人才。

黑客新闻新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 RamAIn (YC W26) 正在招聘 (ycombinator.com) 17小时前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

克利夫兰地下,嘉吉威士忌岛盐矿正不知疲倦地工作,以满足东北部和五大湖地区异常高的融雪盐需求,原因是比往年更严酷的冬季。这个巨大的矿井位于地下1800英尺处,由古代干涸的海域形成,每年开采300万至400万吨盐。 矿工们钻孔、爆破,并通过错综复杂的隧道输送着4.4亿年前的盐,每天生产约11,000至14,000吨的融雪剂。嘉吉报告称,自9月以来一直在加班加点,以应对减少的市政供应和频繁的暴风雪。 尽管需求增加,主管乔治·坎贝尔保证,矿井仍有数十年的储备。该矿井通过卡车、铁路和船只向多个州分发盐,优先向需求最大的地区供应,以应对持续的冬季天气。

## 艾利湖盐矿及相关讨论 - 摘要 一篇近期文章指出,世界最大的湖泊之一艾利湖下存在着一个巨大的盐矿。这引发了黑客新闻的讨论,并延伸到盐矿安全、历史灾难和盐矿开采实践等相关话题。 用户回忆了1980年路易斯安那州的佩格纳湖灾难,钻探引发了盐矿地下塌陷。人们也对盐矿附近的土地开发和沉孔问题表示担忧,例如纽约州卡尤加湖下的盐矿,附近房产所有者需要签署免责声明。 对话涉及了盐矿通风的复杂性以及盐矿开采的独特挑战。有趣的是,休伦湖拥有全球*最大*的盐矿。讨论还涵盖了盐的历史重要性(推荐阅读:马克·库兰斯基的《盐》)和当前的开采方法,包括蒸发池。 最后,用户们辩论了在盐矿中度过时间对健康的潜在益处(盐疗法)以及盐矿开采的整体安全性,并指出盐层结构的稳定性。

## Raincast:AI驱动的桌面应用构建器 Raincast 是一款原生桌面应用程序,可以直接从自然语言描述生成功能完善、可发布的 Tauri 应用。只需描述您想要的应用——从实用工具到复杂的程序,例如 AI 聊天客户端甚至游戏——Raincast 就会构建具有真实 UI、后端功能和系统集成的应用。 它利用 AI(支持 Anthropic、Google Gemini,并可集成其他 AI)生成 React 前端和 Rust 后端,提供 9 个预构建的布局模板。一个独特的实时预览功能让您可以在开发*期间*看到您的应用运行,甚至可以访问文件系统和 shell 命令,这得益于巧妙的代理系统。 Raincast 可以编译为 macOS、Windows 和 Linux 的独立二进制文件,并提供一键发布选项。它可以通过简单的安装脚本或从其 GitHub 仓库手动构建获得。它是一个欢迎贡献的开源项目。

对不起。

启用 JavaScript 和 Cookie 以继续。

对不起。

GitHub Copilot 因开始在开发者提交的拉取请求 (PR) 中插入推广“提示”——本质上是广告——而迅速受到批评,甚至这些 PR 最初并非由 Copilot 创建。澳大利亚开发者 Zach Manson 首先指出了这个问题,发现在使用 Copilot 修复一个拼写错误后,PR 中附加了一条 Raycast 广告。 数千个 PR 受此影响,只要提到 Copilot 的名字,它就会添加这些未经请求的推荐。开发者们对此感到愤怒,认为这种做法具有侵入性,并且滥用了人工智能工具。 GitHub 迅速做出回应,承认这种新行为——允许 Copilot 修改其不负责的 PR——是一个失误。虽然 Copilot 此前曾向其*自身*生成的 PR 添加提示,但将此扩展到其他人证明不受欢迎。GitHub 现在已在拉取请求中禁用了这些“提示”,撤销了该更改并为不想要的广告道歉。

围绕安全漏洞披露的争论——是立即公开缺陷(“完全披露”)还是保密(“不披露”)——已经基本定论为“负责任披露”,这是一种带有修复禁运期的协调方法。这种做法现在已成为国际标准。 然而,区块链技术的漏洞披露更为复杂。除了技术安全之外,区块链的价值还依赖于*公众信任*,而即使没有成功的攻击,散布恐惧、不确定性和怀疑(FUD)也可能损害公众信任。 本文解决了对区块链密码学量子攻击的更新估算。为了减轻FUD,作者首先阐明了区块链的免疫领域以及当前在量子抗性方面的进展。至关重要的是,他们用“零知识证明”来证实他们的发现,*而没有*泄露敏感的攻击细节,从而允许独立验证。 作者倡导继续讨论,以完善专门针对区块链技术所带来的独特挑战的负责任披露规范。

## 量子计算与加密货币安全:摘要 最近来自谷歌等机构的研究强调了量子计算的加速进展,特别是关于肖尔算法及其破坏当前加密标准的可能性。谷歌的一篇论文表明,使用仅需1万个量子比特即可运行该算法,引发了对广泛使用的公钥密码学安全的担忧——包括加密货币和HTTPS中使用的密码学。 谷歌宣布了一个到2029年将系统迁移到后量子密码学(PQC)的计划,引发了关于威胁紧迫性的争论。虽然一些人认为实际的量子因式分解还需数年时间,但另一些人认为时间表很短,需要迅速采取行动。 讨论的重点是过渡到PQC的挑战,包括对新的签名和潜在的对像比特币这样的区块链的影响的需求。 存在争议的是PQC是否真正提供“抵抗力”,还是仅仅缺乏*已知*的量子攻击。人们还对量子计算进展的保密性以及当前加密方法对全球基础设施的更广泛影响表示担忧,这不仅仅局限于加密货币。金融部门持有大量与美国国债挂钩的稳定币资产,也是一个关键的关注领域。

此网站正在使用安全服务来保护自身免受在线攻击。我们正在检查您的浏览器以建立安全连接并保护您安全。请启用JavaScript以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 摇滚明星:解读罗塞塔石碑 (historytoday.com) 14 分,samizdis 发表于 22 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

2026年3月,Trip Venturella发布了“Mr. Chatterbox”,一个独特的语言模型,仅使用来自英国图书馆的28,000多份维多利亚时代(1837-1899)的公共版权书籍进行训练。该模型拥有3.4亿个参数(类似于GPT-2 Medium),旨在展示在不依赖抓取和未经许可的数据的情况下构建LLM的潜力。 目前,Mr. Chatterbox的回复虽然具有独特的维多利亚风格,但还比较基础——更像一个马尔可夫链,而非一个复杂的LLM。开发者承认需要更多训练数据(估计超过70亿个token)才能实现真正的对话能力。 尽管存在局限性,该项目被认为是在完全公共领域资源的基础上构建LLM的一个有希望的步骤。一个名为“llm-mrchatterbox”的插件允许用户使用LLM框架在本地运行2.05GB的模型,展示了在Claude Code的帮助下,插件创建的成功自动化。你可以在[这里](链接到HuggingFace Spaces demo)试用演示。

## Chatterbox先生与LLM训练伦理 - 摘要 由simonwillison.net构建的、经过伦理训练的新型LLM“Chatterbox先生”引发了Hacker News上的讨论。该模型的独特之处在于它仅使用公有领域作品进行训练——具体来说,是1899年之前出版的书籍,以避免版权问题。 对话迅速扩展到训练数据来源的挑战。用户强调了使用LLM数字化英国国家档案馆等庞大档案的潜力,并提到了TimeCapsuleLLM等现有项目。人们对即使在1900年之前的时间范围内,版权限制仍然存在(英国版权在作者去世后70年仍然有效)表示担忧。 一个关键的争论集中在“伦理”训练的含义上。虽然在法律上合规,但一些人认为,未经原始作者明确同意使用数据在伦理上仍然存在问题。另一些人则反驳说,版权本身就存在问题,作者可能没有预料到几个世纪后控制他们的作品。初步测试表明,该模型仅有3.4亿个参数,在连贯对话方面存在困难,这表明数据量和模型大小至关重要。

1982年,瑞典邮政发行了三枚邮票,其中包含奥斯卡·罗特斯瓦德的三幅不可能图形,包括他创作的第一个不可能三角形。这引发了他在祖国瑞典的声誉复兴。同年,一本收录了他作品的画册也出版了。尽管该画册已被翻译成多种语言,但罗特斯瓦德在全球范围内的知名度始终不如埃舍尔。问题在于他是否认为这是个问题。他的不可能图形主要是对一种探索的视觉表达,一种完全掌控他的痴迷的记录。直到1985年和1986年,布鲁诺·恩斯特才在他的著作《不可能图形探险》和《眼花缭乱:视觉错觉》中将两位艺术家联系在一起。与此同时,罗特斯瓦德坚持创作自己的不可能图形,直到2002年去世。

这个Hacker News讨论围绕着瑞典艺术家奥斯卡·罗特斯瓦德的作品,他以创作类似埃舍尔的“不可能结构”而闻名。一位名为layer8的用户分享了罗特斯瓦德的网站链接 (escherinhetpaleis.nl)。 几位评论者分享了与这位艺术家的个人联系——一位拥有在瑞典伦德(罗特斯瓦德居住地)容易找到的原创作品,另一位回忆起在斯德哥尔摩童年时拥有他的复制品。 对话还提到了最近的3Blue1Brown视频,解释了埃舍尔版画背后的几何原理,这启发了一位用户使用WebGL着色器重现这种效果。他们发现这个过程具有挑战性,因为非线性变换对即使是微小的误差也很敏感。总的来说,这个帖子表达了对罗特斯瓦德和埃舍尔视觉上引人入胜的艺术的赞赏。

更多

联系我们 contact @ memedata.com