每日HackerNews RSS

## 通过激活最大化合成提示词,实现高准确率 本项目探索使用激活最大化——一种通常用于理解神经网络的技术——来*生成*大型语言模型(LLM)的有效提示词。作者在学习PyTorch并对激活最大化着迷的同时,旨在展示其超越模型解释的潜力。 激活最大化通过调整训练模型的*输入*,而不是模型的权重,来引发特定的期望输出。该实验使用了Llama-3.2-1B-Instruct和Yelp评论极性(情感分类)数据集。 值得注意的是,通过激活最大化合成的4个token的提示词达到了**95.9%的准确率**,显著优于仅达到**57%**的手写提示词。这是通过将提示词视为连续张量并使用梯度下降对其进行优化来实现的。 作者强调了该技术在需要快速任务切换的场景中的潜力,因为它避免了与模型微调或LoRA训练相关的成本。代码可在GitHub上找到 ([github.com/JoeCooper/PromptByMax](https://github.com/JoeCooper/PromptByMax))。这种方法建立在之前的工作之上,例如Prefix-Tuning (Li & Liang, 2021)。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 通过激活最大化进行提示 (joecooper.me) 5 分,by thatjoeoverthr 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

请启用 JavaScript 并禁用任何广告拦截器。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 美股主导地位对欧洲来说是一场紧急情况 (wsj.com) 11 分,来自 mudil 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 juniperus 11 分钟前 [–] 有趣的是,欧洲被认为是更社会主义,而美国更资本主义,但在美国,公众通过基于养老金的股票市场所有权拥有生产资料,这是共产主义的核心原则之一,而这篇文章指出欧洲的养老金是基于国家或债券投资。当然,美国人通过股票市场对生产资料的所有权所获得的权力并不多,因为这种权力委托给了拥有实际控制权的机构,扮演着与例如更名义上的共产主义体制中的政治局一样的角色。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

很抱歉,在未启用JavaScript的情况下,鸟钟无法正常工作。请启用它以继续。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 鸟类迹象和周期,2024年2月 (subject.space) 5 分,由 sjmulder 2小时前发布 | 隐藏 | 过去的 | 收藏 | 1 条评论 sjmulder 1小时前 [–] 后续年度概述也很漂亮且详尽:https://subject.space/projects-static/medium-year-bird-calen... 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 海底脱盐:解决全球水资源短缺的潜在方案 全球水资源短缺日益严重,预计在五年内需求将超过供应。一种有前景的解决方案来自意想不到的来源:深海。海底脱盐利用约500米深处的巨大静水压力来驱动反渗透——以比传统方法显著更少的能量将淡水从盐水中分离出来。 Flocean、Waterise 和 OceanWell 等公司正在开发和测试原型,旨在实现 40-50% 的节能,并提供模块化、易于部署的系统。深海环境稳定,需要更少的预处理。然而,挑战依然存在。即使考虑到潜在的成本降低,该技术目前仍然昂贵,并且需要大量的能量将水抽回岸上。 需要进一步研究以评估对海洋生态系统的潜在影响,并优化膜技术。理想的地点需要陡峭的海岸线以便高效地建设管道。虽然大规模实施可能还需要十年时间,但长期的政府合同和持续的创新可以为海底脱盐成为全球水资源紧张地区的主流解决方案铺平道路。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 深海淡化从深处提取淡水 (scientificamerican.com) 12 分,由 noleary 发表于 3 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

PuTTY 登陆页 PuTTY 是一款适用于 Windows 和 Unix 的免费软件 SSH 客户端, 包含一个 xterm 风格的终端模拟器。它由 Simon Tatham 编写 并主要维护。 直接前往 下载页面获取最新版本, 或前往 主网站。 谁在运行此登陆页?

流行的 SSH 和 telnet 客户端 PuTTY 现已拥有新的官方网站:putty.software。此前,人们发现长期使用的 putty.org 域名并非由 PuTTY 开发者运营,而是由一家竞争对手运营,他们曾利用该域名推广自己的软件。目前的情况进一步复杂化在于,putty.org 的现任所有者现在托管了无关内容,包括反疫苗信息。 Hacker News 上的讨论强调了用户对新网站设计的反应——相比于原始网站极其简约的美学,这是一个进步——以及对域名抢注的担忧。许多人认为这个问题值得向 ICANN 提起商标诉讼。尽管网站出现了一些问题,用户指出 PuTTY 仍然可用,尤其是在 Windows 终端中使用命令行版本以及在嵌入式系统工作中使用串口通信方面。用户之间的一个玩笑是 PuTTY 是否会最终达到 1.0 版本。

## 构建可扩展的 AI 代理系统:UserJot 的经验 经过几周的实验,UserJot 推出了一款测试版,其中包含 AI 代理来分析客户反馈、自动生成变更日志等等——这些任务以前无法手动完成。关键要点是:**简单至上。** 最有效的架构采用**两层系统**:**主代理**管理上下文并协调任务,而**子代理**执行特定功能,*没有*记忆或共享状态。这种“无状态”方法能够实现并行执行、可预测的结果和更轻松的测试。 至关重要的是,子代理之间的通信是结构化的:清晰的任务、有限的上下文、输出规范和约束条件至关重要。任务分解可以是**垂直的**(顺序步骤)或**水平的**(并行任务),具体取决于依赖关系。 成功的实施依赖于优先考虑**可观察性**(跟踪成功率、性能和错误)并避免过度复杂的层级结构或“智能”代理等常见陷阱。模型选择应与任务复杂度相匹配——简单的任务可以从更快、更便宜的模型中受益。 最终,这些代理是需要明确指导的强大*工具*。通过关注无状态性、结构化通信和简化的架构,UserJot 从用户反馈中释放了可扩展的 AI 驱动的洞察力。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 构建代理AI系统的最佳实践 (userjot.com) 11点 由 vinhnx 1小时前 | 隐藏 | 过去 | 收藏 | 1评论 Der_Einzige 3分钟前 [–] 结构化生成是使代理表现良好的关键,作者将这一点放在首位,暗示他们实际上在构建可用的AI代理。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

访问被拒绝。您没有权限访问此服务器上的“http://media.defense.gov/2025/Jul/25/2003761271/-1/-1/0/SECRET_MESSENGERS.PDF”。 参考编号#18.16d62c17.1755315223.1bc76fac https://errors.edgesuite.net/18.16d62c17.1755315223.1bc76fac

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 秘密信使:二战期间的信号情报传播 [pdf] (defense.gov) 4点 由 sohkamyung 2小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

在疫情期间,业余爱好者吉尔斯·克莱门特将制表推向了极致,决定在地下室完全从头开始制作手表。由泰勒·斯科特·梅森记录,克莱门特不仅仅*修理*钟表,他*创造*它们,制作除机芯以外的所有组件。 令人惊讶的是,克莱门特甚至制造了完成这项任务所需的机器。他利用废钢和剩余零件,制造了两台数控铣床——一台用于表壳等较大组件,另一台用于指针和表盘上的复杂细节,而且是高速的。他还制造了专门的工具,如烫印机、抛光车床和夜光注入器。 克莱门特对细节的执着延伸到设计表盘的字体。他独特的作品可以在网上购买,起价2250美元,展示了非凡的工程和工艺成就。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 从头开始在布鲁克林地下室制作手表 (kottke.org) 8 分,来自 bookofjoe 3 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

尽管人工智能存在不足,但其快速发展——曾经是科幻小说——仍然引人注目,尤其是在语言理解和代码操作方面。然而,由于我们对这些复杂系统的理解有限以及过去预测其进展的失败,预测人工智能的未来是困难的。 当前人工智能能力的停滞是可能的,并且可能刺激进一步的研究,但持续的进步带来独特的经济挑战。与以往的技术繁荣不同,人工智能威胁到广泛的就业岗位,并可能降低对现有服务的需求。 当前市场反应,受到与过去技术繁荣模式匹配的驱动,可能具有误导性。未来由少数人工智能提供商主导是不可持续的,可能需要转向将人工智能作为一种商品,或进行政府干预,甚至从根本上重新评估我们的经济体系。尽管全球局势不稳定,市场仍然乐观,但历史表明,即使是成熟的体系也容易受到变革性变化的冲击——而人工智能很可能引发这种变化。

最近一篇发表在antirez.com上的文章引发了Hacker News的讨论,焦点在于人工智能独特的颠覆潜力。与以往的技术变革同时创造新工作机会不同,评论员们担心人工智能*学习*新角色的能力可能会超过人类再培训的能力。这引发了对失业工人将如何转型的问题,目前尚无明确答案。 一些人认为当前的大型语言模型(LLM)正在停滞,未来的进步需要彻底不同的架构,而另一些人则警告不要过度炒作,并认为目前的轨迹类似于过去的技术泡沫,例如加密货币。对于市场反应是否能洞察人工智能未来的影响,存在分歧。 一个共同的观点是对“大规模取代熟练工人”的说法持怀疑态度,一些人认为这种预测源于渴望显得有见地或缺乏该领域的专业知识。甚至有评论幽默地质疑人工智能是否会取代互联网评论本身!

这项研究使用 Vision Transformer (ViT-Small,约 3 亿参数) 来处理图像块和“注册”令牌(代表非图像数据)的任务。代码使用 `uv` 进行依赖管理,并且数据集需要约 100GB 的存储空间。 训练,使用 320 的批次大小,大约需要 116 小时和 22GB 的 VRAM。可以通过命令行参数使用 `uv run main.py` 来支持恢复训练、评估(包括 IN1k 验证和可视化)以及损失函数绘图。 关键实现细节包括一个独特的 `token_id` 系统,用于跟踪图像块的来源(注册、样本、高度、宽度),因为每个批次处理多个样本/不同分辨率。至关重要的是,在评估之前*必须*调用 `model.eval()`,以确保特殊层的正确行为。 LiDAR 分数是在随机训练子集上计算的,并且在恢复训练时可能会有所变化。支持单 GPU 训练,并提供可选的优化(PILLOW-SIMD、TOME、替代位置嵌入/归一化),但有些会显示性能下降。添加注册令牌显著降低了性能,这是一个目前未解决的问题。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Ijepa 中特征归一化的作用 (github.com/theadamcolton) 3 点赞 bigonion 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com