dd6fe347创建于 4月9日历史提交

文件	最后提交记录	最后更新时间
code_for_change	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
examples	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
finetune	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
model	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
test	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
.gitignore	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
LICENSE	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
LICENSE.txt	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
MODEL_LICENSE.txt	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
README.md	fix link validity Co-authored-by: frozenleaves<914814442@qq.com> # message auto-generated for no-merge-commit merge: !7517 merge master into master fix link validity Created-by: frozenn Commit-by: frozenleaves Merged-by: ascend-robot Description: ## Motivation Please describe the motivation of this PR and the goal you want to achieve through this PR. ## Modification Please briefly describe what modification is made in this PR. ## Self-test (Optional) If modifications to this PR may cause/fix function/accuracy/performance DTSs/issues, a self-inspection record needs to be attached. ## BC-breaking (Optional) If there are compatibility issues, such as dependencies on cann/torch_npu versions, they need to be explained in the PR. ## Checklist Before PR: - [ ] The new code needs to comply with the Clean Code specification. - [ ] The PR content is self-checked, and the expression can be clear and the writing standardized After PR: - [ ] CLA has been signed and all committers have signed the CLA in this PR. - [ ] The ci-pipeline is passed, Code Check is passed. See merge request: Ascend/ModelZoo-PyTorch!7517	1 个月前
api.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
api_hf.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
cli_demo.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
cli_demo_hf.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
finetune_visualglm.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
lora_mixin.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
public_address_statement.md	!7376 optimize public_address_statement.md Merge pull request !7376 from 王凯宇/master	8 个月前
requirements.txt	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
requirements_wo_ds.txt	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
web_demo.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前
web_demo_hf.py	!6719 [built-in][Pytorch] 调整多模态模型存放目录 Merge pull request !6719 from zhangjunyi08/master	1 年前

VisualGLM for PyTorch

概述

简述

VisualGLM-6B 是一个开源的，支持图像、中文和英文的多模态对话语言模型，语言模型基于 ChatGLM-6B，具有 62 亿参数；图像部分通过训练 BLIP2-Qformer 构建起视觉模型与语言模型的桥梁，整体模型共78亿参数。

VisualGLM-6B 依靠来自于 CogView 数据集的30M高质量中文图文对，与300M经过筛选的英文图文对进行预训练，中英文权重相同。该训练方式较好地将视觉信息对齐到ChatGLM的语义空间；之后的微调阶段，模型在长视觉问答数据上训练，以生成符合人类偏好的答案。

参考实现：

url=https://github.com/THUDM/VisualGLM-6B
commit_id=7fd95c2075efa60867c0ea16d061f55878d3d282

适配昇腾 AI 处理器的实现：

url=https://gitcode.com/ascend/ModelZoo-PyTorch.git
code_path=PyTorch/built-in/mlm

准备训练环境

准备环境

当前模型支持的 PyTorch 版本和已知三方库依赖如下表所示。

表 1 版本支持表

Torch_Version 三方库依赖版本

PyTorch 1.11 deepspeed 0.9.2
环境准备指导。

请参考《Pytorch框架训练环境准备》。

Torch_Version	三方库依赖版本
PyTorch 1.11	deepspeed 0.9.2

安装依赖。建议使用conda或者镜像环境，使用python3.7

1. 基本环境

在模型源码包根目录下执行命令，安装模型需要的依赖。

conda create -n env_name python=3.7
pip install -r requirements.txt

2. 安装deepspeed

需要安装指定版本GCC，版本为GCC 7.5.0

pip install deepspeed==0.9.2
git clone git@gitcode.com:ascend/DeepSpeed.git -b v0.9.2 deepspeed_npu
cd deepspeed_npu
pip install -e .

3. 适配迁移代码

首先通过

pip show SwissArmyTransformer

复制输出的Location，设为python_path，在模型目录根目录VisualGLM下，执行：

cp code_for_change/chatglm_model.py  python_path/sat/model/official/chatglm_model.py
cp code_for_change/glm130B_model.py  python_path/sat/model/official/glm130B_model.py
cp code_for_change/rotary_embeddings.py  python_path/sat/model/position_embedding/rotary_embeddings.py

注意

在替换的python_path/sat/model/official/chatglm_model.py文件中，对文件中第26行的gelu_impl(x)函数，有两种实现方式：

$\qquad$ 高精度模式:

      @torch.jit.script
      def gelu_impl(x):
          """OpenAI's gelu implementation."""
          return 0.5 * x * (1.0 + torch.tanh(0.7978845608028654 * x *
                                            (1.0 + 0.044715 * x * x)))

$\qquad$ 高性能模式:

      @torch.jit.script
      def gelu_impl(x):
          return torch.fast_gelu(x)

两种实现本质原理一致，也不会影响模型训练收敛趋势，当前默认使用高性能模式，可以根据需要选择使用。

准备预训练模型

新建文件夹 “glm”，分别下载visualglm和chatglm模型，目录如下所示。

  ├── glm
      ├──visualglm
         ├──1
         ├──latest
         ├──model_config.json
      ├──chatglm

修改model_config.json文件第二行"toeknizer_type"，将其地址设为"path/glm/chatglm"，即chatglm目录所在位置

微调数据集

原仓数据集：解压主文件目录下的fewshot-data.zip，共有中文标注的图片数据20张
从官网下载COCO2017数据集，放到COCO2017目录下

数据集目录结构参考如下所示。
```
├── COCO
   ├──train2017   
   ├──annotations
      ├──captions_train2017.json
```
其中，train2017为图片所在位置，annotations/captions_train2017.json是对应标注所在位置，COCO请大写，代码中通过关键词"COCO"来判定是否使用COCO2017，没有该关键词则使用原仓自带的数据集。

说明： 该数据集的训练过程脚本只作为一种参考示例。

开始训练

微调任务

进入解压后的源码包根目录。
```
cd /${模型文件夹名称}
```

运行训练脚本。

该模型支持单机单卡训练和单机8卡训练。

单机单卡训练

启动单卡训练。

bash test/train_full_1p.sh  COCO2017数据路径  预训练模型路径       # 单卡训练

bash test/train_performance_1p.sh  COCO2017数据路径  预训练模型路径       # 单卡性能

单机8卡训练

启动8卡训练。

bash test/train_full_8p.sh  COCO2017数据路径  预训练模型路径       # 8卡训练

bash test/train_performance_8p.sh  COCO2017数据路径  预训练模型路径       # 8卡性能

--data_path参数填写数据集路径，需写到数据集的一级目录。

模型训练脚本参数说明如下。

训练完成后，权重文件保存在当前路径下，并输出模型训练精度和性能信息。

推理任务

python3 cli_demo.py \
--english \
--from_pretrained test/output/${ASCEND_DEVICE_ID}/checkpoints/ \
--chatglm_path glm/chatglm \
--prompt_en "What's in the image?"

--english使用英文输入，--from_pretrained是训练保存的checkpoints，chatglm_path加载预训练chatglm地址，在glm/chatglm路径下。

训练结果展示

精度结果

通过对比Loss曲线，与竞品Loss平均相对误差为0.4%。

性能结果

训练结果展示表

NAME	Torch Version	Total Steps	Batch Size	FPS	Train Loss
8p-竞品	1.11	20000	8	83.66	2.700
8p-NPU	1.11	20000	8	70.33	2.714

版本说明

变更

2023.05.16：首次发布。

FAQ

无。

公网地址说明

代码涉及公网地址参考 ./public_address_statement.md