Parameter Config
本文档介绍Wan2.1模型的权重及参数配置。
模型权重
模型权重详细信息如表格所示,用户需自行设置权重路径(例:/home/{用户名}/Wan2.1-T2V-14B)。
表 1 模型权重列表
模型
|
说明
|
权重
|
Wan2.1-T2V-14B
|
文生视频模型
|
权重文件请单击链接获取。
|
Wan2.1-I2V-14B-480P
|
图生视频模型
|
权重文件请单击链接获取。
|
Wan2.1-I2V-14B-720P
|
图生视频模型
|
权重文件请单击链接获取。
|
模型参数
用户可自行设置推理脚本中的模型参数,参数解释详情请参见表格。
表 2 模型推理参数说明
参数名
|
参数含义
|
取值
|
model_base
|
权重路径
|
模型权重所在路径。
|
task
|
任务类型
|
支持t2v-14B和i2v-14B。
|
size
|
视频分辨率
|
生成视频的宽*高。
- t2v-14B:模型默认值为1280*720;
- i2v-14B-480P:模型默认值为[832, 480]、[720, 480];
- i2v-14B-720P:模型默认值为[1280, 720]。
|
frame_num
|
生成视频的帧数
|
默认值为81帧。
|
sample_steps
|
采样步数
|
扩散模型的迭代降噪步数,t2v模型默认值为50,i2v模型默认值为40。
|
prompt
|
文本提示词
|
用户自定义,用于控制视频生成。
|
image
|
用于生成视频的图片路径
|
i2v模型推理所需,用户自定义,用于控制视频生成。
|
base_seed
|
随机种子
|
用于视频生成的随机种子。
|
use_attentioncache
|
使能attentioncache算法优化
|
此优化为有损优化,如开启此优化,则需设置参数:start_step、attentioncache_interval、end_step。
- start_step:cache开始的step;
- attentioncache_interval:连续cache数;
- end_step:cache结束的step。
|
nproc_per_node
|
并行卡数
|
- Wan2.1-T2V-14B支持的卡数为1、2、4或8。
- Wan2.1-I2V-14B支持的卡数为1、2、4或8。
|
ulysses_size
|
ulysses并行数
|
默认值为1,ulysses_size * cfg_size = nproc_per_node。
|
cfg_size
|
cfg并行数
|
默认值为1,ulysses_size * cfg_size = nproc_per_node。
|
dit_fsdp
|
DiT使用FSDP
|
DiT模型是否使用完全分片数据并行(Fully Sharded Data Parallel, FSDP)策略。
|
t5_fsdp
|
T5使用FSDP
|
文本到文本传输转换(Text-To-Text Transfer Transformer, T5)模型是否使用FSDP策略。
|
vae_parallel
|
使能vae并行策略
|
vae模型是否使用并行策略。
|
FA_Power_Cap 技术参数
FA_Power_Cap 技术通过 generate.py 的命令行参数控制,适用于开启 Ulysses 序列并行的 Wan 推理场景。默认不启用,保持基线行为。详细手动改代码教程请参见 FA_Power_Cap 技术手动接入指南。
| 参数 |
默认值 |
说明 |
--comm_type |
0 |
单例通信优化枚举。0 表示不启用;1 表示启用通信插入分块,按注意力头切分 Q/K/V 后按块执行 Ulysses AlltoAll -> attention;2 表示启用 block attention 分块,按注意力头切分后再将本地 query 序列固定切成 2 个 attention block。 |
使用约束:
--comm_type 取值只能为 0、1 或 2,三种模式互斥。
- 该优化仅在
ulysses_size > 1 时有意义,且注意力头数需要能够被 Ulysses 并行度整除。
示例:
torchrun --nproc_per_node=8 generate.py --task t2v-14B --ulysses_size 8 --comm_type 1
torchrun --nproc_per_node=8 generate.py --task t2v-14B --ulysses_size 8 --comm_type 2