Parameter Config

本文档介绍Wan2.1模型的权重及参数配置。

模型权重

模型权重详细信息如表格所示，用户需自行设置权重路径（例：/home/{用户名}/Wan2.1-T2V-14B）。

表 1 模型权重列表

模型	说明	权重
Wan2.1-T2V-14B	文生视频模型	权重文件请单击链接获取。
Wan2.1-I2V-14B-480P	图生视频模型	权重文件请单击链接获取。
Wan2.1-I2V-14B-720P	图生视频模型	权重文件请单击链接获取。

模型参数

用户可自行设置推理脚本中的模型参数，参数解释详情请参见表格。

表 2 模型推理参数说明

参数名	参数含义	取值
model_base	权重路径	模型权重所在路径。
task	任务类型	支持t2v-14B和i2v-14B。
size	视频分辨率	生成视频的宽高。 t2v-14B：模型默认值为1280720； i2v-14B-480P：模型默认值为[832, 480]、[720, 480]； i2v-14B-720P：模型默认值为[1280, 720]。
frame_num	生成视频的帧数	默认值为81帧。
sample_steps	采样步数	扩散模型的迭代降噪步数，t2v模型默认值为50，i2v模型默认值为40。
prompt	文本提示词	用户自定义，用于控制视频生成。
image	用于生成视频的图片路径	i2v模型推理所需，用户自定义，用于控制视频生成。
base_seed	随机种子	用于视频生成的随机种子。
use_attentioncache	使能attentioncache算法优化	此优化为有损优化，如开启此优化，则需设置参数：start_step、attentioncache_interval、end_step。 start_step：cache开始的step； attentioncache_interval：连续cache数； end_step：cache结束的step。
nproc_per_node	并行卡数	Wan2.1-T2V-14B支持的卡数为1、2、4或8。 Wan2.1-I2V-14B支持的卡数为1、2、4或8。
ulysses_size	ulysses并行数	默认值为1，ulysses_size * cfg_size = nproc_per_node。
cfg_size	cfg并行数	默认值为1，ulysses_size * cfg_size = nproc_per_node。
dit_fsdp	DiT使用FSDP	DiT模型是否使用完全分片数据并行（Fully Sharded Data Parallel, FSDP）策略。
t5_fsdp	T5使用FSDP	文本到文本传输转换（Text-To-Text Transfer Transformer, T5）模型是否使用FSDP策略。
vae_parallel	使能vae并行策略	vae模型是否使用并行策略。

FA_Power_Cap 技术参数

FA_Power_Cap 技术通过 generate.py 的命令行参数控制，适用于开启 Ulysses 序列并行的 Wan 推理场景。默认不启用，保持基线行为。详细手动改代码教程请参见 FA_Power_Cap 技术手动接入指南。

参数	默认值	说明
`--comm_type`	`0`	单例通信优化枚举。`0` 表示不启用；`1` 表示启用通信插入分块，按注意力头切分 `Q`/`K`/`V` 后按块执行 Ulysses `AlltoAll -> attention`；`2` 表示启用 block attention 分块，按注意力头切分后再将本地 query 序列固定切成 2 个 attention block。

使用约束：

--comm_type 取值只能为 0、1 或 2，三种模式互斥。
该优化仅在 ulysses_size > 1 时有意义，且注意力头数需要能够被 Ulysses 并行度整除。

示例：

# 启用通信插入分块
torchrun --nproc_per_node=8 generate.py --task t2v-14B --ulysses_size 8 --comm_type 1

# 启用 block attention 分块
torchrun --nproc_per_node=8 generate.py --task t2v-14B --ulysses_size 8 --comm_type 2