每日HackerNews RSS

安德鲁正在开发Auraphone,一款利用蓝牙技术革新活动社交的应用。这款应用允许用户仅通过彼此靠近的方式分享联系信息——姓名、照片、社交媒体链接——从而避免了尴尬的交换电话号码的情况。 尽管安德鲁拥有丰富的蓝牙开发经验(包括在Bird电动滑板车公司的工作),但构建Auraphone却出乎意料地复杂,因为许多设备同时广播和连接带来了挑战。安德鲁最初尝试使用客户端-服务器模型来管理连接,但遇到了蓝牙的细微之处以及iOS和Android平台之间的差异问题。 他甚至构建了一个基于Go语言的蓝牙协议栈模拟器来辅助测试,但最终发现实际设备的日志记录对于调试更有效。Auraphone现在已在iOS App Store上架,并提供Android的APK版本,目前正在BLANKSPACES Culver City进行测试。安德鲁正在寻求用户对连接可靠性、数据同步和整体实用性的反馈。目标是提供无缝的社交体验,让用户在轻松捕捉联系信息的同时,能够专注于对话。

## Auraphone:一款社交应用 - 摘要 Auraphone是一款旨在简化活动中信息交换的新应用,超越名片和二维码。其核心理念是利用蓝牙自动收集附近用户的联系信息,同时保持自然的对话流程——消除重复细节的尴尬请求。 开发者设想的应用场景包括商务社交、速配以及基于兴趣的聚会,例如222.place活动。然而,初步反馈显示存在重大障碍:双方都需要下载并主动运行该应用,可能分散注意力,并消耗电池。人们对广泛采用的实用性以及考虑到现有解决方案(如二维码)的情况下,它是否解决了实际问题表示担忧。 过去尝试类似功能(Palm Pilots、Apple的NameDrop、LinkedIn的“查找附近的人”)都面临挑战。开发者强调该应用的去中心化特性——无需后端服务器以保障隐私和可靠性——以及蓝牙在基于近距离连接方面的优势。虽然一些人看到了潜力,尤其是在活动组织者推广该应用的情况下,但许多人质疑其可用性以及它是否能提供足够的优势来克服采用的阻力。

## 大规模数据泄露:20亿凭据暴露 高达19.57亿个独特的电子邮件地址和13亿个密码——其中6.25亿个之前未曾出现——在一个大规模数据聚合中被暴露,现在可以在“我是否被泄露”(Have I Been Pwned, HIBP) 上搜索。 这不是单一的泄露事件,而是来自各种来源的数据汇编,主要来自“窃取器日志”(恶意软件)和“密码填充”列表(来自之前的泄露事件)。 HIBP的验证表明数据是真实的,个人确认旧的、重复使用的密码出现在数据集中——甚至包括当前正在使用的密码。 该数据凸显了密码重用的危险,因为来自看似较小泄露事件的凭据可能会解锁关键帐户。 HIBP已将数据整合到其“已泄露密码”服务中,允许用户在*不*将密码链接到电子邮件地址的情况下检查密码是否已被泄露,优先保护隐私。 处理这个庞大的数据集在技术上具有挑战性且成本高昂,需要对基础设施进行重大升级。 虽然Gmail地址占很大一部分(3.94亿),但此次泄露影响了3200万个域名中的用户。 HIBP正在逐步通知受影响的订阅者,以避免邮件服务器问题。 敦促用户使用密码管理器,创建强大、独特的密码,并启用多因素身份验证。

扎克伯格在帕洛阿尔托的邻居们持续表达对他的家庭住宅区大规模施工和活动活动的担忧。 一位邻居的邮件要求扎克伯格一家停止进一步建设并遵守城市规范,特别是要求获得使用许可和公开听证会,以批准该房产上的学校。他们希望恢复社区先前的宁静住宅环境。 扎克伯格的代表米里亚姆·福克斯承认了“不同寻常”的情况,并强调了邻近可能带来的潜在好处,例如加强安全和提高房产价值。她提到了修改后的停车政策,并承诺提前通知任何干扰,但并未直接回应未获许可的学校或非住宅活动。 城市规划官员也在努力解决邻居的投诉,探讨诸如将学校的使用限制在“辅助性”活动之类的方案。 尽管邻居和官员们进行了跟进,但关于学校许可和整体影响的解决方案仍不明确。

这项研究调查了大型语言模型(LLM)如何表示问题难度,以及这种表示是否与人类理解一致。研究人员发现,LLM能够以高精度解码人类标注的难度,并且这种能力随着模型规模的增大而提高。然而,从LLM自身推导出的难度估计较弱,并且无法随着规模的增大而有效提升。 有趣的是,操纵LLM使其专注于“更简单”的表示,可以提高准确性并减少幻觉。此外,在强化学习过程中,LLM识别人类定义难度的能力随着性能的提高而*增加*,而其内部推导出的难度度量却变得* менее*准确。 这表明LLM最初难以准确评估难度,并且强化学习实际上可能会恶化这种内部评估,同时放大来自人类标注难度的信号。研究人员已发布他们的代码以供进一步研究。

## LLM 与问题难度:总结 一篇最新的研究论文(arxiv.org)探讨了大型语言模型(LLM)如何感知和解决问题,发现它们不像人类那样可靠地判断难度。核心观点是,人类对问题难度的评估与成功解决问题的能力相关,这表明它可能是一个有价值的神经网络训练信号。 讨论的中心在于,LLM 本质上是高级类比机器,推理是类比的链条。一些人认为 LLM 通过压缩训练数据来运作,当问题在这些数据中没有很好地表示时就会遇到困难。另一些人则认为“推理”是引导向量空间内的对话,使其朝向相关的输出方向发展。 一个反复出现的主题是,LLM 经常*幻觉*估计任务难度和时间,这很可能反映了其训练数据中大量项目估算文档中存在的模式——这些文档通常充满了人为的不准确性。最终,许多贡献者建议重新构建我们对 LLM 的理解,将其视为由压缩数据驱动的复杂文本补全工具,而不是真正“智能”的问题解决者。

传统的文档解析基准侧重于文本相似度,忽略了结构保留和下游可用性等关键方面。Tensorlake 通过新的文档解析模型和新颖的评估方法来解决这个问题,使用 **TEDS(树编辑距离相似度)**——衡量结构保真度——和 **JSON F1**——评估实际数据提取准确性。 Tensorlake 的模型在企业文档(银行、零售、保险)上实现了 **91.7% 的准确率**,显著优于 Azure、AWS Textract 和 Docling、Marker 等开源替代方案。它在保留表格结构(OmniDocBench 上的 TEDS 为 86.79%)和维护复杂布局中的正确阅读顺序方面表现出色。 重要的是,Tensorlake 以 **每 1k 页 10 美元** 的价格提供这种卓越的性能,与 Azure 的价格相匹配,同时比 AWS Textract 便宜 50%。该基准测试表明,Tensorlake 不仅仅是识别文本,而是提供结构化、机器可读的数据,为下游 AI 应用(如 RAG 管道和自动化工作流程)做好准备。

## 在工作中找到心流 今天是访问“创造空间”早鸟价(使用代码FALLEARLYBIRD可享40美元)的最后一天。“创造空间”是一个自定进度的日记课程,旨在帮助你重新连接真正重要的事情。此优惠与对耗竭的“努力工作”和感觉自然而快乐的工作之间的差异的反思相吻合。 作者最近观察到这一原则的实际应用——看到一位朋友将写书的过程描述为快乐的体验,并意识到将真实的自我与职业形象保持一致的力量。这种一致性能够带来轻松,并且常常*提高*效率,与普遍存在的“奋斗文化”形成鲜明对比。 个人经历也证实了这一观点:过去的成功源于感觉内在驱动的工作,即使在要求严格的时期也是如此。避免强迫学习,而是追求激情项目——比如构建零食盒应用程序和社区图书馆——释放了快速的进步和毫不费力的学习。 最终,关键不是强制的努力,而是帮助个人找到对他们来说感觉“显而易见”的工作,从而激发他们的内在动力。这种方法在作者的通讯*Startup Soup*中得到了进一步探讨,可以带来更大的动力和产出。思考一下什么能让你充满活力,你即使没有被要求也会做什么,以及“应该做的事情”是否阻碍了你的心流。

## 黑客新闻讨论摘要:让工作感觉更轻松 最近一篇由[jeanhsu.substack.com](jeanhsu.substack.com)上的文章引发的黑客新闻讨论,围绕着寻找*感觉*更轻松的工作(不一定是更简单),以及阻止人们享受工作的因素展开。 核心观点认为,缺乏自主权是主要的负担,尤其是在大型组织中。许多评论者强调了自雇或小型企业的优势,在这些环境中,个人拥有更多的控制权,并能从工作中获得内在回报。然而,他们也指出了小型企业日益增加的准入门槛——复杂的法规、税收以及平台垄断对创作者价值的榨取。 提出的解决方案包括强制开放协议和互操作性,以创造更公平的市场,并简化小型企业的法规。另一些人则告诫不要过于理想化,指出所有工作都存在固有的困难,以及找到有意义的项目的重要性,即使这些项目需要付出努力。人工智能也被讨论为一种潜在工具,可以降低启动项目和在创作中获得初始乐趣的门槛。最终,这场对话强调了人们对有意义和赋能工作的渴望,而不是令人精疲力竭的义务。

TabPFN-2.5是表格基础模型的最新一代,在TabPFN和TabPFNv2的基础上取得了显著进展,极大地推动了表格AI领域的发展。该模型能够处理包含高达50,000个数据点和2,000个特征的数据集——与前代模型相比,数据容量增加了20倍。 TabPFN-2.5明显优于传统的、经过调优的基于树的模型,并实现了与AutoGluon 1.4(一个复杂的、经过4小时调优的集成模型)相当的准确性,*无需*进行大量的调优。一项关键创新是新的知识蒸馏引擎,可以将TabPFN-2.5转换为更快速、更易于部署的模型,如MLP或树集成模型,同时保持高精度和显著降低的延迟。 此版本增强了TabPFN生态系统内的现有应用,并为跨行业的表格数据挑战提供了一种强大、可泛化的解决方案,尤其是在数据稀缺或需要可靠的不确定性估计的情况下。

## 从彩虹到星尘:光谱学史 几个世纪以来,彩虹等现象被认为是神秘的,与神圣的契约或神话中的桥梁有关。然而,1672年,艾萨克·牛顿的棱镜实验彻底改变了我们对光的理解,揭示光并非纯粹,而是所有颜色的组合——光谱。这推翻了2000年的亚里士多德思想。 19世纪,沃拉斯顿和夫琅和费进一步改进了光谱仪,发现了光谱*内部*的暗线(夫琅和费线)。夫琅和费一丝不苟地编目了这些线条,标志着定量光谱学的诞生。科学家很快发现,加热元素会产生独特的发射光谱——特定颜色的光,而这些与吸收光谱中的暗线相对应。 这一突破允许识别元素,从而发现了铯和铷等新元素。至关重要的是,光谱学扩展到地球之外,使天文学家能够分析星光。这揭示了恒星的组成,证明它们不仅仅是遥远的太阳,而是锻造元素的宇宙熔炉——包括构成*我们*的元素。 从识别恒星中的锝到证实萨根关于我们是“星尘”的诗意想法,光谱学改变了我们对宇宙和我们在其中地位的理解,这一切都源于对彩虹的简单研究。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 光中的幽灵:早期光谱学的故事 (chrisdempewolf.com) 10 分,来自 dempedempe 1 天前 | 隐藏 | 过去 | 收藏 | 讨论 考虑申请YC冬季2026批次!申请截止至11月10日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## openDesk:概要 openDesk 是一套可定制的办公和协作套件,专为德国公共部门的需求而设计。它由 ZenDiS GmbH 受联邦内政部委托开发,优先考虑数字主权、安全性和无缝协作。 该套件将基本办公应用——包括任务、聊天、电子邮件、日历、文档管理和视频会议——集成到一个用户友好的界面中。openDesk 基于开放标准构建,并利用成熟的开源解决方案,提供模块化扩展性和移动优化。 目前,openDesk 的目标是在 2025 年底达到 16 万个许可证,并在各个行政级别上获得越来越多的应用。像 1.8 版本这样的更新侧重于稳定性和安全性的改进以及效率的提升。文档、路线图和博客等资源可供进一步探索。感兴趣的各方可以申请演示,以便亲身体验 openDesk。

## OpenDesk:德国政府办公套件 OpenDesk是由德国政府开发的综合性一体化办公套件,旨在为公共部门提供微软365和谷歌工作空间的替代方案。它包括文档编辑(由Collabora/LibreOffice提供支持)、电子邮件、聊天(通过Matrix)、视频会议和维基等功能。 讨论的重点是其**较高的系统要求**——12核和32GB内存——最初用于评估部署,引发了关于小型组织或家庭使用实用性的问题。虽然设计目标是服务15万德国政府用户,但有人建议从较小的部门开始分阶段推广会更有效。 人们对Matrix的元数据可见性表示担忧,但后来澄清仅限于服务器管理员。该项目对公共部门的关注也存在争议,有人质疑政府雇员是否需要与普通公众根本不同的办公工具。 另一条相关讨论指出,国际刑事法院放弃了微软365而选择了OpenDesk。

## 软件供应链安全:信任侵蚀与新兴防御 现代软件依赖于内在的信任——下载的代码是真实的,来自预期的来源,并且功能如预期。然而,这种信任正日益被攻击者利用,这从PyPI和npm等注册表中删除的数千个恶意软件包、项目中注入的恶意软件以及XZ Utils事件等几乎成功的后门中可见一斑。传统的依赖项扫描只能识别*已知*漏洞,无法保护免受拼写错误、维护者被入侵或构建管道中毒的影响。 攻击者采用欺骗性软件包命名(拼写错误和依赖混淆)和凭证盗窃等策略来入侵发布者并注入恶意代码。他们越来越多地将目标锁定在构建过程本身,如SolarWinds和Ultralytics攻击所示。即使是受信任的维护者也存在风险,以XZ Utils持续入侵事件为例。 防御正在演变。像**TypoGard/Typomania**这样的工具对抗拼写错误,**Zizmor**分析GitHub Actions中的漏洞,而**PyPI的Trusted Publishing & attestations**(使用Sigstore)验证构建来源。**Homebrew**现在为瓶子构建使用证明,**Capslock**则用于分析Go包的能力。 最终,确保软件供应链安全需要从隐式信任转向*明确、可验证的保证*。积极措施、整个生态系统的改进以及关注验证代码*能做什么*,而不仅仅是*来自哪里*,对于建立弹性至关重要。

更多

联系我们 contact @ memedata.com