## Wan2.2:高级开源视频生成
Wan2.2是基础视频模型的重大升级,专注于提高质量、效率和控制力。主要创新包括**混合专家(MoE)架构**——在不增加计算成本的情况下提高模型容量——以及精心策划的美学数据,用于**电影级别的视频生成**。
Wan2.2在更大的数据集上进行训练(图像增加+65.6%,视频增加+83.2%),在**复杂运动生成**方面表现出色,优于开源和闭源模型。一个突出的特点是**TI2V-5B模型**,这是一个拥有50亿参数且具有高效VAE的模型,实现16x16x4压缩,能够在**消费级GPU(如4090)上生成720P@24fps视频**。
Wan2.2支持**文本生成视频、图像生成视频和文本-图像生成视频**,并与**Hugging Face、ComfyUI和Diffusers**等流行平台集成。该项目提供了全面的工具,包括推理代码、模型权重以及对FP8量化等高效训练技术的支持。
资源,包括模型和代码,可在[GitHub](https://github.com/Wan-Video/Wan2.2.git)上获取。