每日HackerNews RSS

## Arc Core:高性能时序数据仓库 (Alpha) Arc Core 是一个基于 DuckDB、Parquet 和 MinIO 构建的全新高性能时序数据仓库。目前处于积极开发阶段(Alpha 版本),旨在实现快速分析查询和可扩展的存储。 **主要特性:** * **高摄取速率:** 使用 MessagePack 可达到高达 **189 万条记录/秒**,远快于 Line Protocol。支持 InfluxDB Line Protocol 以兼容现有系统。 * **可扩展存储:** 利用 MinIO(S3 兼容对象存储)实现无限扩展和成本效益,支持本地磁盘、AWS S3 和 GCS。 * **强大的查询能力:** 使用 DuckDB 查询引擎进行快速 SQL 分析。 * **易于部署:** 可通过 Docker 或原生部署(原生部署速度快 2.4 倍)。 * **数据导入:** 支持从 InfluxDB 和 TimescaleDB 导入数据。 **最佳配置:** 使用 MessagePack 协议和 3 倍 CPU 核心数量的工作线程,进行原生部署并搭配 MinIO。 **重要提示:** 这是一个 Alpha 版本,**不建议用于生产环境**。它仅用于开发和测试。该项目正在积极发展,并不断进行性能改进和功能添加。 **资源:** API 文档可在 `http://localhost:8000/docs` 访问。社区支持通过 GitHub Issues 提供,企业支持可通过电子邮件获得。

## Arc:快速时序数据平台 Basekick Labs 创始人 Ignacio 介绍了 Arc,一个新型开源时序数据平台,专为高速数据摄取*和*强大的分析而设计。Arc 使用 MessagePack API 实现快速数据接收(在 M3 Pro Max 上达到约 188 万条记录/秒),并支持 InfluxDB Line Protocol 以实现兼容性。 数据以 Parquet 格式存储,并按小时进行分区,从而能够通过 DuckDB 引擎使用标准 SQL 进行高效查询。该项目旨在克服其他系统中常见的保留、吞吐量和复杂性之间的权衡。 基准测试显示出强大的性能,包括 35.18 秒的 ClickBench 冷启动运行时间和约 0.81 秒的热启动运行时间。开发者欢迎反馈和用例想法,特别是那些寻求自托管 DuckDB 服务替代方案(如 MotherDuck)的用户。名称“Arc”的选择是对“Ark”的致敬,代表数据存储,但避免了圣经含义。

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

一种名为微型递归模型(TRM)的AI问题解决新方法,在具有挑战性的解谜任务中展现出令人惊讶的结果,表现优于更大的语言模型(LLM)。该模型在一篇最近的arXiv论文中被描述,它利用了一个非常小的神经网络——仅有700万个参数和两层——以及递归推理。 这建立在之前关于分层推理模型(HRM)的工作基础上,但通过更简单的设计实现了显著更好的泛化能力。TRM在ARC-AGI基准测试中取得了令人印象深刻的准确率(ARC-AGI-1为45%,ARC-AGI-2为8%),超越了Deepseek R1和Gemini 2.5 Pro等模型的性能,尽管其规模远小于它们。 这项研究表明,复杂的问题并不*需要*巨大的模型,并且使用微型网络进行高效的递归推理,对未来的AI发展具有重要意义。

欧盟的好消息和隐私的重大胜利!🇪🇺🇩🇪 德国执政党基民盟/基社盟今天明确表示:在现任德国政府下,不会有其他欧盟国家推动的聊天控制。40秒简短而精确:有了基民盟/基社盟,将不会有像一些欧盟国家要求的那样无理由的聊天监控。

## 聊天控制辩论升温 德国政府反对拟议的“聊天控制”立法,引发了 Hacker News 上关于加密通信和合法拦截未来的讨论。 一个关键点是,目前的聊天控制方案在实践中不可行——可能会破坏网上银行和其他基本服务。然而,执法部门越来越需要访问加密聊天以进行调查,尤其是在涉及金融犯罪方面。 这场辩论的核心在于根本性的冲突:要求访问端到端加密 (E2E) 通信与在不损害所有人安全的情况下实现这一目标的技术不可能性的矛盾。一些人认为聊天服务应该像传统电信一样受到监管,而另一些人则优先考虑隐私,即使这意味着增加恶意软件风险或限制在线服务。 最终,需要达成妥协,但找到一种平衡安全、隐私和执法需求解决方案仍然是一个重大挑战。

## Lisp 类语言中的线程 作者是一位 Common Lisp 爱好者,同时使用 Clojure 和 TypeScript,探索在其他语言中重现 Clojure 方便的线程宏。线程宏通过以自然、从左到右的顺序表达一系列函数应用来增强可读性,从而消除过多的括号。 然而,线程宏依赖于 Lisp 中常见的强大宏系统,而在其他地方则不太常见。这促使人们研究*线程组合器*——传递闭包以实现类似效果的函数。作者在他们的语言 Lamber 中实现了这个概念,使用 `piping`、`pipe` 和 `piped` 函数。 `piping` 启动过程,`pipe` 通过闭包将函数链接在一起并按顺序应用它们,而 `piped` 作为终止符,返回最终值。即使使用像 `->` 这样的简写别名,由于 Lamber 的极简设计,生成的语法仍然有些冗长,但作者认为可以在其他语言中用专用运算符更简洁地实现类似的概念。该方法侧重于“thread-last”风格,符合 Lamber 偏爱尾重函数参数的偏好。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 函数式线程“宏” (aartaka.me) 12 分,GarethX 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

“蒂莉·诺伍德”(Tilly Norwood)是一位由埃琳·范德韦尔登开发的AI演员,她的出现引发了演艺界的争议和担忧。范德韦尔登设想诺伍德可以成为斯嘉丽·约翰逊等巨星的潜在继任者,但美国影视演员工会(SAG-Aftra)强烈谴责了这个AI角色,认为它缺乏人类表演中固有的生活经验和情感深度。 该工会强调观众更喜欢植根于人类经验的内容。女演员艾米莉·布朗特表达了同样的观点,称这个想法“令人恐惧”,并敦促经纪公司抵制用AI取代演员。 范德韦尔登为她的创作辩护,称其是一件旨在引发讨论的艺术品,而非取代人类演员。这场争论凸显了人们对AI对娱乐产业影响以及人类艺术价值日益增长的担忧。

## AI生成罗宾·威廉姆斯内容引发抗议 罗宾·威廉姆斯的女儿泽尔达·威廉姆斯公开恳求人们停止创作和向她发送其父亲的AI生成视频。她认为这种做法“令人作呕”,是对其父亲遗产的不尊重,将其比作消费“人体蜈蚣”的内容。 Hacker News上的讨论凸显了对AI伦理影响的更广泛担忧,特别是其在重现已故人士方面的应用。虽然一些人承认AI的潜在好处,但许多人同意威廉姆斯的观点,认识到数字复活某人以供娱乐的固有不尊重。 针对名人形象的法律保护是存在的(例如在加利福尼亚州),但个人AI创作的简易性使得执法变得困难。这场辩论延伸到AI生成的“历史照片”以及过去内容的普遍“回收利用”。一些人认为问题不在于技术本身,而在于其滥用,而另一些人则质疑在不考虑其后果的情况下,对技术进步的不懈追求。最终,这场对话凸显了人们对AI生成内容不受控制的泛滥及其对悲伤、遗产和艺术完整性的影响日益增长的不适。

## B+树节点内存布局:性能权衡 为了在B+树中实现高性能,需要为每个节点提供连续的内存布局,以最大化CPU缓存的利用率。标准的C++ `std::vector` 会引入内存间接寻址,阻碍了这一目标。解决方案是采用一种“结构技巧”——利用柔性数组成员(C99和C++11标准化)来定义一个类,其最后一个成员是动态大小的数组。 这种技术允许为节点的元数据和数据分配单个连续的内存块,避免了指针追逐和缓存缺失。然而,它也带来了代价:需要手动内存管理,偏离了惯用的C++实践。必须小心地编排释放内存,并且向派生类添加成员可能导致数据损坏。 此外,该实现有效地“重新发明”了`std::vector` 的一部分,并引入了隐藏的约束——特别是,要求在节点内使用的所有数据类型都必须是可平凡复制的。尽管存在这些缺点,但优化内存访问所带来的性能提升使得这种权衡对于要求苛刻的应用来说是必要的。

黑客新闻新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 缓存友好的B+树节点,具有动态扇出 (jacobsherin.com) 10 分,由 jasim 52 分钟前发布 | 隐藏 | 过去 | 收藏 | 讨论 考虑申请YC冬季2026批次!申请截止日期为11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 为Web逆向工程构建浏览器 该项目详细介绍了为逆向工程师定制浏览器的过程,旨在简化诸如分析混淆的JavaScript、识别指纹识别技术和绕过反机器人措施等任务。 最初使用Chrome扩展的尝试因内容脚本隔离而失败,导致转向使用Chrome开发者工具协议 (CDP)。 核心功能涉及在页面脚本加载*之前* 挂载JavaScript函数(如`Array.prototype.push`),从而可以观察和修改行为。 使用Electron构建的原型成功地证明了这一点,为用户界面铺平了道路,该界面具有挂载函数事件显示、画布指纹识别分析以及使用deobfuscate.io等工具进行脚本去混淆的功能。 进一步的开发包括克服Cloudflare的Turnstile等服务使用的进程外iframe (OOPiF) 带来的挑战,方法是利用CDP的`Target.attachedToTarget`事件。 最终目标是超越Electron,并将UI直接嵌入到分叉的Chromium构建中,从而能够在Blink渲染引擎中实现更深层的挂载,并为更隐蔽的工具化定制CDP域。 该项目展示了一种强大的工具,用于解剖现代Web安全和反机器人措施,并具有未来AI辅助分析的潜力。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 为逆向工程师构建浏览器 (nullpt.rs) 16 分,hazebooth 29 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 lapcat 11 分钟前 [–] 重复,昨天已提交:https://news.ycombinator.com/item?id=45492489 回复 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Pigeon 正在招聘首席全栈工程师 Pigeon是一家获得YC W23支持的公司,致力于利用人工智能自动化文档生命周期。现寻求一位积极进取的**首席全栈软件工程师**加入他们由4人组成的团队。该职位提供塑造公司技术、流程和文化的机会,并对他们的客户群产生重大影响。 理想的候选人应具备5年以上全栈经验,并在快节奏的早期阶段环境中茁壮成长。职责包括负责核心服务、构建和扩展他们的人工智能驱动的文档处理系统,以及推动从概念到部署的功能。 Pigeon的技术栈包括AWS、Kubernetes、Vercel、Python (Flask, FastAPI) 和 Javascript (NextJS, React)。他们提供具有竞争力的福利,包括医疗保健、401(k)、无限休假和Macbook Pro。最近完成350万美元的种子轮融资,Pigeon已准备好快速增长,并正在寻找一位领导者来帮助他们navigate下一阶段。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Pigeon (YC W23) 正在招聘全栈工程师负责人 (ycombinator.com) 30分钟前 | 隐藏 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

这段对话突显了在Rails 8应用中尝试集成较新工具时,现代Web开发日益增长的复杂性。凯文热情地提倡一种混合技术栈——Vite、React、TypeScript以及Babel、PostCSS、Tailwind、ESLint、Prettier和Husky等一系列相关工具,以实现“极快的”性能。 然而,这需要大量的设置,包括Node.js、Docker、Redis,以及针对特定功能可能需要的Next.js/Remix或StimulusReflex/ActionCable。约翰最初感到好奇,但很快就被所需的大量依赖和配置所淹没。 讽刺的是,凯文将这种复杂性称为“简单”,而约翰展示了一个完全可用的、速度极快的Rails应用,它*仅*使用Rails构建,表明核心框架在没有额外开销的情况下仍然非常高效。这次交流最终强调了一种对追逐流行技术,以牺牲简单性和强大、优化的基础框架的批判。

一篇名为“你对Rails理解错了”的文章引发了Hacker News的讨论,凸显了Web开发中一个持续存在的争论。核心观点围绕着Ruby on Rails的优势——开箱即用和简洁性——与JavaScript生态系统经常出现的复杂性和碎片化之间的对比。 许多评论者表达了对JavaScript的“工具疲劳”,并欣赏Rails的效率。一些人预测,随着编码代理的兴起,Rails可能会迎来“复兴”,因为编码代理难以处理过度的复杂性。然而,也有人指出Rails在新生产环境中的地位正在下降,经常被静态构建和JavaScript框架所取代。 一个关键点是,用户通常无法察觉Rails或React应用程序之间的区别,而简洁性可能是一种优势。讨论质疑了对于更简单的应用程序来说,过度工程化的前端堆栈的必要性,并提到了像37signals这样的公司,它们仍然有效地使用Rails。

本文介绍了理解线性方程组的两个核心概念:**高斯消元法**和**行/列图像**。 高斯消元法是一种求解这些方程的方法——例如,确定凑成23美分的镍币和便士数量,或达到特定碳水化合物/蛋白质目标的牛奶和面包用量——通过策略性地操纵方程来隔离变量。这种技术早于正式的线性代数,并且依赖于减去方程的倍数来简化并求解未知数。 然后,本文将此与线性代数的视角进行对比。“行图像”将方程可视化为图形上的直线,解是它们的交点。或者,“列图像”使用*向量*(数字数组)来表示方程,并将解视为达到目标向量的这些向量的组合。 这种将向量视为箭头或点的转变是线性代数的基础思想,允许以一种新的、可能更直观的方式表达和求解方程。本文结尾暗示使用*矩阵*来紧凑地表示这些方程,为进一步探索线性代数概念奠定了基础。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 线性代数的图文介绍 (ducktyped.org) 17 分,egonschiele 发表于 2 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 adastra22 发表于 0 分钟前 [–] 在 iOS Safari 暗黑模式下,图片显示为空白。回复 考虑申请 YC 2026 冬季批次!申请截止日期为 11 月 10 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com