每日HackerNews RSS

本文挑战了视觉Transformer (ViT) 因二次自注意力机制而难以处理高分辨率图像的观点。作者认为,ViT能够很好地扩展到1024x1024像素²,足以满足大多数图像编码任务。跨不同GPU的基准测试表明,ViT比同等CNN更快,内存效率更高,尤其是在较新的硬件上。 作者还强调,高分辨率并非总是必要的,认为对于许多任务来说,较低分辨率(224-896像素²)就足够了,因为计算机视觉模型不需要人类那样高的审美细节。高分辨率下的性能提升往往是由于模型容量(FLOPs)的增加,而不是仅仅由于分辨率的提高。 此外,文章还重点介绍了局部注意力机制,例如ViTDet中的机制,它通过将注意力限制在局部窗口内来提高ViT在高分辨率下的速度和内存效率。作者总结道,ViT是一种可行且通常优于CNN的替代方案,提倡通过实证评估来克服先入为主的局限性。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 VIT 和 CNN 的速度 (lucasb.eyer.be) jxmorris12 2 小时前 6 分 | 隐藏 | 过去 | 收藏 | 讨论 加入我们 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

1968年,Codd提出的元胞自动机(CA)旨在简化冯·诺依曼的自复制元胞自动机,减少所需状态数。冯·诺依曼使用了29个状态,而Codd仅用8个状态就实现了计算和构造的普适性。Codd证明了在他的元胞自动机中存在自复制机器的可能性,其灵感来自冯·诺依曼的普适构造器,但完整的实现直到很久以后才完成。 其他研究人员进一步简化了这一概念。Banks创造了一个具有普适计算和构造能力的4状态元胞自动机,但它不能自复制。Devore缩小了Codd设计的规模,并在1992年通过模拟演示了后代的构建。Langton在1984年创造了具有更少细胞的自复制循环,但牺牲了普适计算能力。基于王氏W机的Codd自复制计算机最终在2009年由Hutton实现,后者纠正了Codd原始设计中的细微错误。

Hacker News 最新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Codd 细胞自动机 (wikipedia.org) Petiver 2小时前 3 分 | 隐藏 | 往期 | 收藏 | 讨论 加入我们 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

请提供需要翻译的内容。

一篇关于“摇头丸帝国”的文章在Hacker News上引发了一场讨论,讨论的中心是成年人负责任的吸毒行为。最初的评论哀叹缺乏适度,人们要么完全戒掉,要么沉迷其中。评论者们提供了各种不同的观点和经历。一些人提到,某些州的合法大麻促进了休闲使用,将其比作睡前喝啤酒。另一些人指出,像柏林和丹佛这样的地方是偶尔使用者的天堂。一位评论者开玩笑地谈到了极端对比的生活方式。一位在成为父母之前戒毒的用户也参与了讨论。另一位用户表示,如果他们能够接触到,他们会偶尔使用摇头丸。总之,这场讨论反映了围绕吸毒的各种不同经历以及在戒断和滥用之间寻找中间地带的挑战。

TScale是一个基于C++/CUDA的Transformer库,旨在高效地在消费级硬件(特别是NVIDIA GPU)上进行大型语言模型(LLM)的训练和推理。它通过优化的架构、更快的收敛速度、降低的注意力计算成本以及对FP8/INT8精度的支持来实现这一点。 主要特性包括:CPU卸载以减少GPU内存占用;在同构主机上进行同步分布式训练;在异构的、地理位置分散的主机上进行异步分布式训练,并使用1比特梯度压缩以最大限度地减少网络开销。 TScale展示了一种新颖的“模型大小”方法,它使用一个较小的模型配合一个巨大的(1TB)索引进行token预测,从而显著降低了困惑度。 编译需要CUDA v12.3和C++编译器(Windows使用MSVC,Linux使用CMake/Clang)。训练使用脚本进行数据处理和模型训练,分布式训练支持`pow2`数量的工作主机。每个工作主机可以使用多个GPU。 推理通过`gpt_infer`启用,这是一个提供模型延续的基本HTTP服务器,但目前它针对演示而非速度进行了优化。

Hacker News的一个帖子讨论了TScale,一个针对消费级GPU的分布式训练系统。一个用户询问如何在多个主机上划分推理任务,另一个用户建议llama.cpp已经具备此功能。 接下来的讨论转向了ASML在AI发展中的作用。一位用户假设了一个荷兰政府关闭ASML的场景,这将影响AI的进展。这引发了辩论,另一位用户认为ASML不受政府控制,并且许多公司对半导体产业至关重要。另一位发帖者提到ASML的研究是公开的,其他国家,例如中国,也在EUV光刻技术方面取得了进展。

请启用JavaScript和Cookie以继续

Hacker News 最新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 AI驱动机器人安装近1万块太阳能组件于澳大利亚 (renewablesnow.com) 8 分,来自 joak,32 分钟前 | 隐藏 | 往期 | 收藏 | 1 评论 WalterGR 15 分钟前 [–] https://cleantechnica.com/2025/04/25/meet-the-robot-replacin... 有关机器人的更多信息。 回复 加入我们 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指导原则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

您的浏览器禁用了 JavaScript。请启用 JavaScript 以继续。本网站的必需部分无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置造成的。请检查您的网络连接,禁用任何广告拦截器,或尝试使用其他浏览器。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 儿童意识脑电图监测安全减少麻醉剂用量 (news.mit.edu) 5 分,来自 LorenDB,2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 加入我们,参加 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

2007年,比利·贝克写到了他妻子劳里的意外经历——她成为了俄罗斯方块的世界纪录保持者。一次与电子游戏裁判的谈话启发了贝克,他发现妻子的俄罗斯方块技术超群。这促使他们前往新罕布什尔州的Funspot,美国经典街机博物馆的所在地,尝试挑战Game Boy俄罗斯方块的世界纪录。 起初,他们被告知纪录是327行,但事实证明,劳里玩的彩色版游戏的纪录是545行。但这并没有阻止劳里,她在裁判和一群游戏玩家面前现场比赛。尽管压力重重,分心不断,她仍然打破了现有纪录,达到了惊人的841行。这一成就让她赢得了“世界最伟大的俄罗斯方块玩家”的称号,也让贝克开始思考精通技艺的意义,最终把整理行李箱的任务交给了他这位精通俄罗斯方块的妻子。

Hacker News上的一条讨论串围绕着boston.com的一篇文章展开,文章标题为“‘Bizarro World’”。文章内容似乎是关于超级马里奥兄弟的速度竞赛。评论者jmcgough澄清说,虽然Gardikis曾经以完美的5分8秒速通而闻名,但这个记录已经被打破。现在已经有七名跑者达到了4分54秒的记录。曾经占据统治地位的跑者Andrewg现在排名下降,而Nifski目前被认为是社区中最强的选手。另一位评论者ljf称赞了这篇文章,并提供了一个链接,指向Hacker News上之前关于这个话题的讨论。

sxwm 是一款轻量、快速且可配置的窗口管理器,仅需 libX11 和 Xinerama 即可运行。它提供平铺和浮动布局,九个集成工作区,并支持通过用户友好的 `~/.config/sxwmrc` 文件实时重新加载配置。主要功能包括受 DWM 启发的主窗格布局、鼠标窗口操作支持以及 Xinerama 多显示器支持。 配置选项包括设置修饰键、间隙、边框宽度、颜色、主窗格宽度百分比以及用于更平滑鼠标操作的运动节流。可以轻松定义键绑定,用于外部命令和内部功能,例如窗口管理、工作区切换和间隙调整。文中给出了启动终端、关闭窗口和在工作区之间移动等常见操作的键绑定示例。文档还提供了使用 GCC 或 Clang 的简单构建和安装说明。

16岁的开发者uint23在Hacker News上发帖推广其在GitHub上托管的窗口平铺管理器sxwm。他们将sxwm描述为一个易于配置、未经修改且轻量级的替代方案,可以替代现有的DWM和i3等窗口平铺管理器。uint23声称sxwm的代码行数(LOC)比DWM少。 这篇文章引发了一些讨论。一位用户ed_mercer提到在尝试了i3和Hyprland之后,想念macOS的UI。其他人则质疑uint23将DWM描述为不完整,将i3描述为臃肿的说法,并质疑为什么代码行数少于DWM对于最终用户来说一定是一个优点。

Niklaus Wirth于1979年在瑞士苏黎世联邦理工学院(ETH Zurich)创建的Modula-2语言,于1980年催生了Lilith工作站。Lilith的工作站软件包括Modula-2编译器、操作系统和编辑器。最初的编译器运行在PDP-11上,随后出现了PC版本,它为Lilith生成M代码,并通过M2M-PC系统(一个M代码解释器)在MS-DOS上执行。Gutknecht和Wirth于1985年发布了一个更快的单遍编译器。之后,又创建了一个为Motorola 68000/68040处理器生成原生代码的版本,并用于MacMETH系统。相关的资源包括编译器源代码、M2M-PC系统、Modula-2手册、关于代码生成和编译的论文,以及Wirth的著作《Programming in Modula-2》。《The Art of Simplicity》也包含相关的章节。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 莉莉丝与Modula-2(astrobe.com) 8 分,来自 kristianp,1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 加入我们,参加 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

天文学家Terry Long Phan的团队通过分析间隔23年的IRAS和AKARI红外巡天存档数据,发现了一个潜在的第九行星候选者。这个天体位于距离太阳约700天文单位的地方,其运动轨迹与第九行星的预测路径一致。不同于与物种大灭绝相关的“X行星”理论,第九行星的假设提出于2016年,旨在解释柯伊伯带天体异常的轨道。 如果得到证实,这个候选者将比海王星更大,超过了最初对超级地球大小的预期。它的发现取决于未来使用像暗能量相机这样的强大望远镜进行观测,以准确确定其轨道。第九行星遥远且偏心轨道的起源仍然是一个谜,可能性包括受到巨行星的引力散射或捕获一颗流浪行星。虽然之前在IRAS数据中发现过另一个距离太阳较近的潜在候选者,但Phan发现的天体由于在IRAS和AKARI数据中都被探测到,因此更有希望。南希·格雷斯·罗曼太空望远镜和维拉·鲁宾天文台不久将开始搜寻第九行星,为进一步证实提供更多机会。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 23年前后天空调查中发现了有争议的第九行星的证据 (space.com) spchampion2 2小时前 15 分 | 隐藏 | 过去 | 收藏 | 2 条评论 bikenaga 1小时前 | 下一条 [–] 原文:https://arxiv.org/pdf/2504.17288 回复 metalman 18分钟前 | 上一条 [–] 我们已经有第九颗行星了,但由于有史以来最迂腐的运动,冥王星被降级了。不过,鉴于目前的形势,哈哈!这可能会改变……也许命名委员会会被注意到,并有机会达成协议,让冥王星再次成为行星(MPAPA) 回复 加入我们,参加6月16日至17日在旧金山举办的AI创业学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

更多

联系我们 contact @ memedata.com