dd6fe347创建于 4月9日历史提交

文件	最后提交记录	最后更新时间
configs	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
libs	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
scripts	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
test	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
tools	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
LICENSE	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
README.md	fix link validity Co-authored-by: frozenleaves<914814442@qq.com> # message auto-generated for no-merge-commit merge: !7517 merge master into master fix link validity Created-by: frozenn Commit-by: frozenleaves Merged-by: ascend-robot Description: ## Motivation Please describe the motivation of this PR and the goal you want to achieve through this PR. ## Modification Please briefly describe what modification is made in this PR. ## Self-test (Optional) If modifications to this PR may cause/fix function/accuracy/performance DTSs/issues, a self-inspection record needs to be attached. ## BC-breaking (Optional) If there are compatibility issues, such as dependencies on cann/torch_npu versions, they need to be explained in the PR. ## Checklist Before PR: - [ ] The new code needs to comply with the Clean Code specification. - [ ] The PR content is self-checked, and the expression can be clear and the writing standardized After PR: - [ ] CLA has been signed and all committers have signed the CLA in this PR. - [ ] The ci-pipeline is passed, Code Check is passed. See merge request: Ascend/ModelZoo-PyTorch!7517	1 个月前
datasets.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
dpm_solver_pp.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
dpm_solver_pytorch.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
eval.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
eval_ldm.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
eval_ldm_discrete.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
eval_t2i_discrete.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
public_address_statement.md	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
requirements.txt	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
sample_t2i_discrete.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
sde.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
train.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
train_ldm.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
train_ldm_discrete.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
train_t2i_discrete.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
utils.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前

U-ViT for Pytorch

简介

模型介绍

U-ViT是一个结合了扩散概率模型和Transformer的图像生成模型，在扩散模型中，使用ViT代替基于CNN的U-Net。本仓库主要将U-ViT模型迁移到了昇腾NPU上。

支持任务列表

本仓已经支持以下模型任务类型

模型	任务列表	是否支持
U-ViT	train	✔

代码实现

参考实现：

url=https://github.com/baofff/U-ViT
commit_id=ce551708dc9cde9818d2af7d84dfadfeb7bd9034

适配昇腾 AI 处理器的实现：

url=https://gitcode.com/ascend/ModelZoo-PyTorch.git
code_path=PyTorch/built-in/diffusion/

U-ViT(在研版本)

准备训练环境

安装模型环境

表 1 三方库版本支持表

三方库	支持版本
PyTorch	1.11.0
accelerate	0.12.0
torchvision	0.12.0

在模型源码包根目录下执行命令，安装模型需要的依赖。

pip install -r requirements.txt

安装昇腾环境

请参考昇腾社区中《Pytorch框架训练环境准备》文档搭建昇腾环境，本仓已支持表2中软件版本。

表 2 昇腾软件版本支持表

软件类型	支持版本
FrameworkPTAdapter	在研版本
CANN	在研版本
昇腾NPU固件	在研版本
昇腾NPU驱动	在研版本

准备数据集

用户需自行获取并解压ImageNet数据集，并放在当前目录下assets/datasets/ImageNet文件夹中

参考数据结构如下：

assets/datasets/ImageNet
├── train
├── val
└── ...

获取训练相关权重

基于原仓Readme中Preparation Before Training and Evaluation一节内提供的链接下载Autoencoder相关文件，并放在当前目录下assets/stable-diffusion文件夹中

参考数据结构如下：

assets/stable-diffusion
├── autoencoder_kl.pth
└── autoencoder_kl.pth

基于原仓Readme中Preparation Before Training and Evaluation一节提供的链接下载Reference statistics for FID相关文件，并放在当前目录下assets/fid_stats文件夹中

参考数据结构如下：

assets/fid_stats
├── fid_stats_celeba64_train_50000_ddim.npz
├── fid_stats_cifar10_train_pytorch.npz
├── fid_stats_imagenet256_guided_diffusion.npz
├── fid_stats_imagenet512_guided_diffusion.npz
├── fid_stats_imagenet64_guided_diffusion.npz
└── fid_stats_mscoco256_val.npz

快速开始

训练任务

开始训练

进入解压后的源码包根目录。
```
cd /${模型文件夹名称} 
```

运行训练脚本。

该模型支持单机8卡训练。

单机8卡训练

bash test/train_imagenet64_uvit_large.sh # 8卡训练

训练脚本参数说明如下

train_imagenet64_uvit_large.sh
--num_processes           //训练用卡数
--train_script            //训练脚本
--config                  //训练参数

训练结果

性能

芯片	卡数	FPS	batch_size	AMP_Type	Torch_Version
GPU	8p	1136.64	1024	fp16	1.13
Atlas 800T A2	8p	860.50	1024	fp16	1.11

公网地址说明

代码涉及公网地址参考 public_address_statement.md

变更说明

变更

2024.05.06：U-ViT fp16训练任务首次发布。

FAQ

暂无