Parameter Config

本文档介绍Wan2.1模型的权重及参数配置。

模型权重

模型权重详细信息如表格所示,用户需自行设置权重路径(例:/home/{用户名}/Wan2.1-T2V-14B)。

表 1 模型权重列表

模型

说明

权重

Wan2.1-T2V-14B

文生视频模型

权重文件请单击链接获取。

Wan2.1-I2V-14B-480P

图生视频模型

权重文件请单击链接获取。

Wan2.1-I2V-14B-720P

图生视频模型

权重文件请单击链接获取。

模型参数

用户可自行设置推理脚本中的模型参数,参数解释详情请参见表格。

表 2 模型推理参数说明

参数名

参数含义

取值

model_base

权重路径

模型权重所在路径。

task

任务类型

支持t2v-14B和i2v-14B。

size

视频分辨率

生成视频的宽*高。

  • t2v-14B:模型默认值为1280*720;
  • i2v-14B-480P:模型默认值为[832, 480]、[720, 480];
  • i2v-14B-720P:模型默认值为[1280, 720]。

frame_num

生成视频的帧数

默认值为81帧。

sample_steps

采样步数

扩散模型的迭代降噪步数,t2v模型默认值为50,i2v模型默认值为40。

prompt

文本提示词

用户自定义,用于控制视频生成。

image

用于生成视频的图片路径

i2v模型推理所需,用户自定义,用于控制视频生成。

base_seed

随机种子

用于视频生成的随机种子。

use_attentioncache

使能attentioncache算法优化

此优化为有损优化,如开启此优化,则需设置参数:start_step、attentioncache_interval、end_step。

  • start_step:cache开始的step;
  • attentioncache_interval:连续cache数;
  • end_step:cache结束的step。

nproc_per_node

并行卡数

  • Wan2.1-T2V-14B支持的卡数为1、2、4或8。
  • Wan2.1-I2V-14B支持的卡数为1、2、4或8。

ulysses_size

ulysses并行数

默认值为1,ulysses_size * cfg_size = nproc_per_node。

cfg_size

cfg并行数

默认值为1,ulysses_size * cfg_size = nproc_per_node。

dit_fsdp

DiT使用FSDP

DiT模型是否使用完全分片数据并行(Fully Sharded Data Parallel, FSDP)策略。

t5_fsdp

T5使用FSDP

文本到文本传输转换(Text-To-Text Transfer Transformer, T5)模型是否使用FSDP策略。

vae_parallel

使能vae并行策略

vae模型是否使用并行策略。