每日HackerNews RSS

## 数据库性能中的时空局部性 近期在PGConf NYC的讨论,由Postgres 18的异步IO工作引发,强调了正向和反向数据扫描之间的性能差异。这源于操作系统预取数据的方式——对正向扫描有效,但对反向扫描无效,揭示了**局部性**在数据库性能中的重要性。 局部性包括**时间局部性**(最近访问的数据很可能再次被访问)和**空间局部性**(附近的数据很可能很快被访问)。一个关键假设是**时空局部性**:在同一时间写入的数据将在同一时间被读取,因此应该存储在一起。 这个假设并非普遍成立。流式系统和时序数据库从中受益匪浅,而基于哈希的数据库(如DynamoDB)则故意避免它以加快写入速度,牺牲读取性能。关系数据库通常使用时间顺序的键,有时以牺牲写入性能为代价,并且数据库系统通常会实现优化来减轻缺点。 作者认为,对于典型的OLTP工作负载,这个假设是弱成立的,最近的数据是“热”数据。最终,理解并为时空局部性设计——或者有意识地拒绝它——对于根据特定工作负载特征优化数据库性能至关重要。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Locality, and Temporal-Spatial Hypothesis (brooker.co.za) 6点 由 jandrewrogers 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 考虑申请YC的2026冬季批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

最近谷歌对开发者验证的新要求引发了对开源Android替代方案(如F-Droid和定制ROM)未来发展的担忧。用户担心此举预示着Android生态系统将朝着更封闭的方向发展,可能模仿苹果的限制性做法。 Hacker News上的讨论凸显了人们对日益增长的数字限制日益增长的沮丧,一些人认为在监管严格的世界中,期望完全控制自己的设备是不现实的。另一些人则认为谷歌的行为是借安全措施之名行控制之实,将控制权置于用户之上,而非为了用户。 许多评论者表达了摆脱Android的愿望,希望出现可行的替代方案,如基于Linux的手机(尽管目前的Pinephone等项目被认为不够成熟)。总体情绪表明,用户自由正在丧失,开源移动领域可能正在萎缩。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 数据中心投资热潮背后的模糊经济学 (economist.com) 10点 由 1vuio0pswjnm7 40分钟前 | 隐藏 | 过去 | 收藏 | 1评论 rzk 22分钟前 [–] https://archive.is/5CY26 回复 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 飞机尾迹:航空业中一项出人意料的廉价气候解决方案 尽管完全脱碳航空旅行成本高昂,但航空业造成的显著变暖影响——可能高达一半——来自飞机尾迹,即飞机留下的白色轨迹。令人惊讶的是,减少尾迹的成本可能非常*低廉*。 由Contrails.org和谷歌“尾迹项目”等组织率先提出的解决方案涉及重新规划航线,以避开产生这些增温尾迹的大气条件。详细的预测和人工智能建模可以识别这些区域,从而实现轻微的绕行——通常只需几分钟——以避开它们。 虽然二氧化碳排放会持续数百年,但尾迹的增温效应是短暂的,几天内就会消失。重要的是,只有一小部分航班(约2-5%)造成了大部分尾迹增温。这意味着仅解决这些航班就能带来显著效益。 估计成本仅为每航班5-10美元,或每位乘客几美分——远比可持续航空燃料便宜。尽管如此,航空公司尚未广泛采用这种做法,这可能是由于担心成本增加(尽管可以轻松转嫁给消费者)以及引起人们对航空业整体气候影响的关注。政府监管,例如欧盟最近强制报告非二氧化碳影响的规定,似乎是实施的最可能途径,同时还需要提高公众对这种现成的气候解决方案的认识。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 消除飞机凝结尾迹可能非常便宜 (sustainabilitybynumbers.com) 8 分,K2L8M11N2 26 分钟前 | 隐藏 | 过去 | 收藏 | 2 条评论 jagged-chisel 1 分钟前 | 下一个 [–] 改变航线会增加多少燃料(额外里程)和时间(乘客生命)成本?回复 pavel_lishin 3 分钟前 | 上一个 [–] 我不知道凝结尾迹实际上比废气造成更多的暖化。回复 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

太阳能现在已经非常经济实惠,在阳光最充足的国家,每产生一单位电力成本低至2便士,比从煤炭、天然气或风能产生的电力更便宜,这是萨里大学一项新研究的结果。

## 太阳能现已最便宜:摘要 一项最新研究(surrey.ac.uk)表明太阳能现在是最便宜的能源,引发了Hacker News上的讨论。虽然已经具有成本效益,但一些地区由于供应过剩而出现“太阳能自食其果”的现象。 用户讨论了电池存储成本的日益降低(预计很快达到每千瓦时40美元),这可能实现高水平的家庭能源独立。关于太阳能和风能是否构成“真正的”基础电力,存在争论,许多人认为电网灵活性——利用互联网络、水电甚至燃气发电厂——可以有效解决间歇性问题。有人对输电损耗表示担忧,但高压直流(HVDC)技术提供了一种潜在的解决方案,但实施成本高昂。 对话强调了太阳能的优势——灵活性、可扩展性和无污染——但也指出了阻碍更广泛采用的监管障碍和掠夺性融资行为。许多评论员强调了考虑*总*成本的重要性,包括土地使用、环境影响以及化石燃料的隐藏成本(健康、排放)。还探讨了大规模能源传输的可能性,例如泛欧电网。

## 现代出版业中“销售记录”的重量 托妮·莫里森的《最蓝的眼睛》最初虽然广受好评,但商业上却并不成功。直到几十年后被奥普拉读书俱乐部选中,才获得巨大成功——同时莫里森也达到了文学界的超星地位。然而,如今的作家面临着对即时销售额的巨大压力。这种压力源于出版业对“销售记录”的痴迷——作者过去的销售数据,它极大地影响着作品的采纳决定。 出版商现在优先考虑可证明的商业潜力,通常倾向于拥有现有平台或已证实销售记录的作者。这形成了一种两难境地:新作者需要强劲的开端来建立销售记录,但缺乏销售记录来*获得*强劲的开端。即使是已经成名的作家,后续作品也会被拿来与之前的表现进行比较,从而扼杀创作风险和职业发展。 BookScan等数据追踪的兴起加剧了这种趋势,将出版业变成了一场高风险的赌博。虽然小型出版社提供了更多的灵活性,但它们也受到行业内对数字的关注影响。媒体环境的萎缩和宣传机会的减少进一步使情况复杂化。最终,对销售记录的强调可能会优先考虑畅销书潜力,而不是培养多样化的声音和长期的文学发展,从而可能损害作者和文学文化的健康。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 出版业存在赌博问题 (thewalrus.ca) 7 分,Caiero 发表于 35 分钟前 | 隐藏 | 过去 | 收藏 | 讨论 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Arc Core:高性能时序数据仓库 (Alpha) Arc Core 是一个基于 DuckDB、Parquet 和 MinIO 构建的全新高性能时序数据仓库。目前处于积极开发阶段(Alpha 版本),旨在实现快速分析查询和可扩展的存储。 **主要特性:** * **高摄取速率:** 使用 MessagePack 可达到高达 **189 万条记录/秒**,远快于 Line Protocol。支持 InfluxDB Line Protocol 以兼容现有系统。 * **可扩展存储:** 利用 MinIO(S3 兼容对象存储)实现无限扩展和成本效益,支持本地磁盘、AWS S3 和 GCS。 * **强大的查询能力:** 使用 DuckDB 查询引擎进行快速 SQL 分析。 * **易于部署:** 可通过 Docker 或原生部署(原生部署速度快 2.4 倍)。 * **数据导入:** 支持从 InfluxDB 和 TimescaleDB 导入数据。 **最佳配置:** 使用 MessagePack 协议和 3 倍 CPU 核心数量的工作线程,进行原生部署并搭配 MinIO。 **重要提示:** 这是一个 Alpha 版本,**不建议用于生产环境**。它仅用于开发和测试。该项目正在积极发展,并不断进行性能改进和功能添加。 **资源:** API 文档可在 `http://localhost:8000/docs` 访问。社区支持通过 GitHub Issues 提供,企业支持可通过电子邮件获得。

## Arc:快速时序数据平台 Basekick Labs 创始人 Ignacio 介绍了 Arc,一个新型开源时序数据平台,专为高速数据摄取*和*强大的分析而设计。Arc 使用 MessagePack API 实现快速数据接收(在 M3 Pro Max 上达到约 188 万条记录/秒),并支持 InfluxDB Line Protocol 以实现兼容性。 数据以 Parquet 格式存储,并按小时进行分区,从而能够通过 DuckDB 引擎使用标准 SQL 进行高效查询。该项目旨在克服其他系统中常见的保留、吞吐量和复杂性之间的权衡。 基准测试显示出强大的性能,包括 35.18 秒的 ClickBench 冷启动运行时间和约 0.81 秒的热启动运行时间。开发者欢迎反馈和用例想法,特别是那些寻求自托管 DuckDB 服务替代方案(如 MotherDuck)的用户。名称“Arc”的选择是对“Ark”的致敬,代表数据存储,但避免了圣经含义。

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

一种名为微型递归模型(TRM)的AI问题解决新方法,在具有挑战性的解谜任务中展现出令人惊讶的结果,表现优于更大的语言模型(LLM)。该模型在一篇最近的arXiv论文中被描述,它利用了一个非常小的神经网络——仅有700万个参数和两层——以及递归推理。 这建立在之前关于分层推理模型(HRM)的工作基础上,但通过更简单的设计实现了显著更好的泛化能力。TRM在ARC-AGI基准测试中取得了令人印象深刻的准确率(ARC-AGI-1为45%,ARC-AGI-2为8%),超越了Deepseek R1和Gemini 2.5 Pro等模型的性能,尽管其规模远小于它们。 这项研究表明,复杂的问题并不*需要*巨大的模型,并且使用微型网络进行高效的递归推理,对未来的AI发展具有重要意义。

欧盟的好消息和隐私的重大胜利!🇪🇺🇩🇪 德国执政党基民盟/基社盟今天明确表示:在现任德国政府下,不会有其他欧盟国家推动的聊天控制。40秒简短而精确:有了基民盟/基社盟,将不会有像一些欧盟国家要求的那样无理由的聊天监控。

## 聊天控制辩论升温 德国政府反对拟议的“聊天控制”立法,引发了 Hacker News 上关于加密通信和合法拦截未来的讨论。 一个关键点是,目前的聊天控制方案在实践中不可行——可能会破坏网上银行和其他基本服务。然而,执法部门越来越需要访问加密聊天以进行调查,尤其是在涉及金融犯罪方面。 这场辩论的核心在于根本性的冲突:要求访问端到端加密 (E2E) 通信与在不损害所有人安全的情况下实现这一目标的技术不可能性的矛盾。一些人认为聊天服务应该像传统电信一样受到监管,而另一些人则优先考虑隐私,即使这意味着增加恶意软件风险或限制在线服务。 最终,需要达成妥协,但找到一种平衡安全、隐私和执法需求解决方案仍然是一个重大挑战。

## Lisp 类语言中的线程 作者是一位 Common Lisp 爱好者,同时使用 Clojure 和 TypeScript,探索在其他语言中重现 Clojure 方便的线程宏。线程宏通过以自然、从左到右的顺序表达一系列函数应用来增强可读性,从而消除过多的括号。 然而,线程宏依赖于 Lisp 中常见的强大宏系统,而在其他地方则不太常见。这促使人们研究*线程组合器*——传递闭包以实现类似效果的函数。作者在他们的语言 Lamber 中实现了这个概念,使用 `piping`、`pipe` 和 `piped` 函数。 `piping` 启动过程,`pipe` 通过闭包将函数链接在一起并按顺序应用它们,而 `piped` 作为终止符,返回最终值。即使使用像 `->` 这样的简写别名,由于 Lamber 的极简设计,生成的语法仍然有些冗长,但作者认为可以在其他语言中用专用运算符更简洁地实现类似的概念。该方法侧重于“thread-last”风格,符合 Lamber 偏爱尾重函数参数的偏好。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 函数式线程“宏” (aartaka.me) 12 分,GarethX 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

更多

联系我们 contact @ memedata.com