| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
原始链接: https://news.ycombinator.com/item?id=44029435
Hacker News 上的一篇帖子讨论了 Sean Goedecke 对扩散模型(用于图像生成)的简化解释。核心思想是:向图像添加随机噪声每次都会产生略微不同的噪声图像,但这些噪声图像指向原始图像的“流形”(代表自然图像的低维空间)。因此,模型可以反转噪声来重建图像。 评论者分享了麻省理工学院的扩散模型课程、Tony Duan 的数学解释和 Lilian Weng 的详细概述等资源。讨论还涉及到扩散模型与自回归模型(如大型语言模型中使用的模型)的比较,强调了自回归图像建模的最新进展,这些进展挑战了扩散模型的主导地位。讨论包括 GPT-4 是否使用了这些较新的自回归技术。 还简要讨论了文本扩散及其发展初期的阶段。 原文中缺乏合适的图片也被提及。
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
So you will always know where to go to restore the original image: shortest distance to the natural image manifold.
How all these random images end up perpendicular to the manifold? High dimensional statistics and the fact that the natural image manifold has much lower dimension than the overall space.
reply