SOLOV2模型-推理指导

概述
推理环境准备
快速上手
- 准备数据集
- 模型推理
模型推理性能

概述

SOLOV2模型是一个box-free的实例分割模型。SOLOV2相对SOLOV1的主要改动有两点，一是通过一个有效的整体实例掩码表示方案来实现，该方案动态地分割图像中的每个实例，而不需要使用边界盒检测。具体来说，目标掩码的生成（Mask generation）分解为掩码核预测（Mask kernel prediction）和掩码特征学习（Mask feature learning），分别负责生成卷积核和待卷积的特征映射。二是SOLOV2通过我们的新矩阵显著减少了推理开销非最大抑制（NMS）技术。

参考实现：

url=https://github.com/WXinlong/SOLO
branch=master
commit_id=95f3732d5fbb0d7c7044c7dd074f439d48a72ce5

通过Git获取对应commit_id的代码方法如下：

git clone {repository_url}        # 克隆仓库的代码
cd {repository_name}              # 切换到模型的代码仓目录
git checkout {branch/tag}         # 切换到对应分支
git reset --hard {commit_id}      # 代码设置到对应的commit_id（可选）
cd {code_path}                    # 切换到模型代码所在路径，若仓库下只有该模型，则无需切换

输入输出数据

输入数据

输入数据数据类型大小数据排布格式

input RGB_FP32 batchsize x 3 x 800 x 1216 NCHW
输出数据

输出数据大小数据类型数据排布格式

output1 100 x 200 x 304 FLOAT32 ND

output2 100 INT32 ND

output3 100 FLOAT32 ND

输入数据	数据类型	大小	数据排布格式
input	RGB_FP32	batchsize x 3 x 800 x 1216	NCHW

输出数据	大小	数据类型	数据排布格式
output1	100 x 200 x 304	FLOAT32	ND
output2	100	INT32	ND
output3	100	FLOAT32	ND

推理环境准备[所有版本]

该模型需要以下插件与驱动

表 1 版本配套表

配套	版本	环境准备指导
固件与驱动	1.0.15	Pytorch框架推理环境准备
CANN	5.1.RC2	-
Python	3.8.13	-
PyTorch	1.9.0	-
说明：Atlas 300I Duo 推理卡请以CANN版本选择实际固件与驱动版本。	\	\

快速上手

获取源码

获取开源代码仓。

在已下载的源码包根目录下，执行如下命令。

git clone https://github.com/WXinlong/SOLO.git -b master
cd SOLO
git reset --hard 95f3732d5fbb0d7c7044c7dd074f439d48a72ce5
cd ..

安装依赖。

pip3 install -r requirements.txt

其中mmcv安装建议参考官方安装指导说明

其中mmdet需要用以下方式安装。

cd SOLO
patch -p1 < ../MMDET.diff
patch -p1 < ../SOLOV2.diff
pip install -v -e .
cd ..

安装auto-optimizer改图工具。请访问auto-optimizer改图工具代码仓，根据readme文档进行工具安装。

准备数据集

获取原始数据集。（解压命令参考tar –xvf *.tar与 unzip *.zip）

本模型需要coco2017数据集，数据集下载地址https://cocodataset.org/

请将val2017图片及其标注文件放入服务器/root/dataset/coco/文件夹，val2017目录存放coco数据集的验证集图片，annotations目录存放coco数据集的instances_val2017.json，文件目录结构如下：
```
├──root
    └──dataset
        └──coco
           └──annotations
           └──val2017
```
数据预处理。
```
python3 solov2_preprocess.py --image_src_path=/root/dataset/coco/val2017  --bin_file_path=val2017_bin --meta_file_path=val2017_bin_meta --model_input_height=800  --model_input_width=1216
```
- --image_src_path：数据集路径
- --bin_file_path：生成的图片bin文件路径
- --meta_file_path：生成的图片附加信息路径（临时信息，get_info.py需要用到）
每个图像对应生成一个二进制bin文件，一个附加信息文件。
生成数据集info文件。

执行“get_info.py”，会生成“solov2_meta.info”用于后处理。
```
python3 get_info.py /root/dataset/coco/  SOLO/configs/solov2/solov2_r50_fpn_8gpu_1x.py  val2017_bin  val2017_bin_meta  solov2.info  solov2_meta.info  1216 800
```
- “/root/dataset/coco/”：数据集路径。
- “SOLO/configs/solo/solo_r50_fpn_8gpu_1x.py”：模型配置文件。
- “val2017_bin”：预处理后的数据文件的相对路径。
- “val2017_bin_meta”：预处理后的数据文件的相对路径。
- solo.info：生成的数据集文件保存的路径。
- solo2_meta.info：生成的数据集文件保存的路径。
- “1216”：图片宽。
- “800”：图片高。
运行成功后，在当前目录中生成“solov2_meta.info”。

模型推理

模型转换。

使用PyTorch将模型权重文件.pth转换为.onnx文件，再使用ATC工具将.onnx文件转为离线推理模型文件.om文件。

获取权重文件。

获取权重文件：SOLOv2_R50_1x.pth，请将其放在与“pth2onnx.py”文件同一目录内。
安装环境

由于原版的MMDET无法在NPU环境中运行，我们对MMDET进行了修改，请确保已经利用MMDET.diff文件对其进行修改并安装完必要的环境。

导出onnx文件。

使用“SOLOv2_R50_1x.pth”，导出onnx文件。

运行“pth2onnx.py”脚本。

python3 solov2_pth2onnx.py --config SOLO/configs/solov2/solov2_r50_fpn_8gpu_1x.py --pth_path SOLOv2_R50_1x.pth --out SOLOv2.onnx --shape 800 1216

获得SOLOv2.onnx文件。

优化ONNX文件。
```
python3 -m onnxsim SOLOv2.onnx SOLOv2_sim.onnx
```
获得SOLOv2_sim.onnx文件。

使用auto_optimizer工具改图。

python3 -m auto_optimizer optimize SOLOv2_sim.onnx SOLOv2_opt.onnx

获得SOLOv2_opt.onnx文件。

使用ATC工具将ONNX模型转OM模型。

配置环境变量。
```
source /usr/local/Ascend/ascend-toolkit/set_env.sh
export LD_LIBRARY_PATH=/usr/local/Ascend/driver/lib64/driver/:${LD_LIBRARY_PATH}
```
说明： 该脚本中环境变量仅供参考，请以实际安装环境配置环境变量。详细介绍请参见《CANN 开发辅助工具指南 (推理)》。

执行命令查看芯片名称（${chip_name}）。

npu-smi info
#该设备芯片名为Ascend310P3 （自行替换）
回显如下：
+-------------------+-----------------+------------------------------------------------------+
| NPU     Name      | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device    | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===================+=================+======================================================+
| 0       310P3     | OK              | 15.8         42                0    / 0              |
| 0       0         | 0000:82:00.0    | 0            1074 / 21534                            |
+===================+=================+======================================================+
| 1       310P3     | OK              | 15.4         43                0    / 0              |
| 0       1         | 0000:89:00.0    | 0            1070 / 21534                            |
+===================+=================+======================================================+

执行ATC命令。

创建customize_dtypes.cfg文件

文件内容： OpType::MatMulV2:InputDtype:float16,OutputDtype:float16
```
atc --framework=5 --model=SOLOv2_opt.onnx --output=solov2  --input_format=NCHW --input_shape="input:1,3,800,1216" --customize_dtypes=customize_dtypes.cfg --precision_mode=force_fp16 --log=error --soc_version=Ascend${chip_name}
```
- 参数说明：
  - --model：为ONNX模型文件。
  - --framework：5代表ONNX模型。
  - --output：输出的OM模型。
  - --input_format：输入数据的格式。
  - --input_shape：输入数据的shape。
  - --log：日志级别。
  - --soc_version：处理器型号。
  - --customize_dtypes：自定义算子的计算精度。
  - --precision_mode：其余算子的精度模式。
  运行成功后生成solov2.om模型文件。

开始推理验证。

a. 安装ais_bench推理工具。

请访问ais_bench推理工具代码仓，根据readme文档进行工具安装。

b. 执行推理。

推理完成后即可输出性能结果。
```
python3 -m ais_bench --model ./solov2.om --input ./val2017_bin/ --output ./result/ --outfmt BIN --loop 1
```
- 参数说明：
- --model 需要进行推理的om模型
- --input 图片bin文件路径
- --output 推理结果输出路径。默认会建立日期+时间的子文件夹保存输出结果如果指定output_dirname 将保存到output_dirname 的子文件夹下。
- --outfmt 输出数据的格式，默认”BIN“，可取值“NPY”、“BIN”、“TXT”
- --loop 推理次数，可选参数，默认1，profiler为true时，推荐为1 推理后的输出默认在当前目录result下。
c. 后处理。

执行solov2_preprocess.py文件，脚本执行完毕后即可生成精度结果。
```
python3 solov2_postprocess.py  --dataset_path=/root/dataset/coco/   --model_config=SOLO/configs/solov2/solov2_r50_fpn_8gpu_1x.py  --bin_data_path=./result/2022_09_02-17_04_20/  --meta_info=solov2_meta.info  --net_out_num=3  --model_input_height 800  --model_input_width 1216
```
- 参数说明：
- -dataset_path：数据集路径。
- --model_config：模型配置文件。
- --bin_data_path：执行推理后的数据文件的相对路径。
- --meta_info：生成的数据集文件保存的路径。
- --net_out_num：输出节点数。
- --model_input_height：图片高。
- --model_input_width ：图片宽。

模型推理性能&精度

调用ACL接口推理计算，性能参考下列数据。

芯片型号	Batch Size	数据集	精度	性能
300I Pro	1	coco2017	34.0％	22.1411 fps