7ea8f2f9创建于 2024年11月28日历史提交

文件	最后提交记录	最后更新时间
LICENSE	!2116 [西安交通大学软件学院][高校贡献][PyTorch离线推理][SSDResnet34]-初次提交 * SSDResnet34	3 年前
README.md	!6851 [Clean Code] 修改芯片型号描述 Merge pull request !6851 from 施康/master	1 年前
modelzoo_level.txt	!2116 [西安交通大学软件学院][高校贡献][PyTorch离线推理][SSDResnet34]-初次提交 * SSDResnet34	3 年前
public_address_statement.md	!6055 整改公网地址 Merge pull request !6055 from 胡一鸣/master	2 年前
requirements.txt	!2116 [西安交通大学软件学院][高校贡献][PyTorch离线推理][SSDResnet34]-初次提交 * SSDResnet34	3 年前
ssd.patch	!2116 [西安交通大学软件学院][高校贡献][PyTorch离线推理][SSDResnet34]-初次提交 * SSDResnet34	3 年前
ssd_postprocess.py	!2116 [西安交通大学软件学院][高校贡献][PyTorch离线推理][SSDResnet34]-初次提交 * SSDResnet34	3 年前
ssd_preprocess.py	!2116 [西安交通大学软件学院][高校贡献][PyTorch离线推理][SSDResnet34]-初次提交 * SSDResnet34	3 年前
ssd_pth2onnx.py	!2116 [西安交通大学软件学院][高校贡献][PyTorch离线推理][SSDResnet34]-初次提交 * SSDResnet34	3 年前

SSDResNet34模型-推理指导

概述
推理环境准备
快速上手
模型推理性能

概述

SSD模型是用于图像检测的模型，通过基于Resnet34残差卷积网络(基础网络)，并向网络添加辅助结构，产生具有多尺度特征图的预测。在多个尺度的特征图中使用不同的默认框形状，可以有效地离散地输出不同大小的框，面对不同的目标可以有效地检测到，并且还可以对目标进行识别。

参考实现：

url=https://github.com/mlcommons/training_results_v0.7
branch=master
commit_id=elc4b963b6a4ee8fbd40fc5cd9edb9789a2982de
model_name=ssd

通过Git获取对应commit_id的代码方法如下：

git clone {repository_url}        # 克隆仓库的代码
cd {repository_name}              # 切换到模型的代码仓目录
git checkout {branch/tag}         # 切换到对应分支
git reset --hard {commit_id}      # 代码设置到对应的commit_id（可选）
cd {code_path}                    # 切换到模型代码所在路径，若仓库下只有该模型，则无需切换

输入输出数据

输入数据

输入数据数据类型大小数据排布格式

input RGB_FP32 batchsize x 3 x 300 x 300 NCHW
输出数据

输出数据大小数据类型数据排布格式

ploc Batchsize x 4 x 8732 FLOAT32 ND

plabel Batchsize x 81 x 8732 FLOAT32 ND

输入数据	数据类型	大小	数据排布格式
input	RGB_FP32	batchsize x 3 x 300 x 300	NCHW

输出数据	大小	数据类型	数据排布格式
ploc	Batchsize x 4 x 8732	FLOAT32	ND
plabel	Batchsize x 81 x 8732	FLOAT32	ND

推理环境

该模型需要以下插件与驱动

表 1 版本配套表

配套	版本	环境准备指导
固件与驱动	1.0.15	Pytorch框架推理环境准备
CANN	5.1.RC2	-
Python	3.7.5	-
说明：Atlas 300I Duo 推理卡请以CANN版本选择实际固件与驱动版本。	\	\

快速上手

获取源码

获取开源仓代码

git clone https://github.com/mlcommons/training_results_v0.7.git
cd training_results_v0.7/NVIDIA/benchmarks/ssd/implementations/pytorch/ 
patch -p1 <../../../../../../ssd.patch       # 通过补丁修改仓库代码
mv -n * ../../../../../../      # 移动到模型所在路径
cd -

安装依赖。

获取昇腾版本工具安装包

# x86_64平台
wget https://ascend-pytorch-release.obs.cn-north-4.myhuaweicloud.com/run_pkg/20211018_FrameworkPTAdapter2.0.T308/torch-1.5.0%2Bascend.post3.20210930-cp37-cp37m-linux_x86_64.whl
wget https://ascend-pytorch-release.obs.cn-north-4.myhuaweicloud.com/run_pkg/20211018_FrameworkPTAdapter2.0.T308/apex-0.1%2Bascend.20210930-cp37-cp37m-linux_x86_64.whl

# arm平台
wget https://ascend-pytorch-release.obs.cn-north-4.myhuaweicloud.com/run_pkg/20211018_FrameworkPTAdapter2.0.T308/torch-1.5.0%2Bascend.post3.20210930-cp37-cp37m-linux_aarch64.whl
wget https://ascend-pytorch-release.obs.cn-north-4.myhuaweicloud.com/run_pkg/20211018_FrameworkPTAdapter2.0.T308/apex-0.1%2Bascend.20210930-cp37-cp37m-linux_aarch64.whl

若安装包无法通过wget下载，则可通过下述百度云网盘下载

链接：https://pan.baidu.com/s/1xH3ZSP63NRukAPMlI4ePNw 
提取码：rcof

安装环境

git clone https://github.com/mlperf/logging.git mlperf-logging
pip install -e mlperf-logging
pip install torch-1.5.0+ascend.post3.20210930-cp37-cp37m-linux_x86_64.whl
pip install apex-0.1+ascend.20210930-cp37-cp37m-linux_x86_64.whl
pip3 install -r requirements.txt

准备数据集

获取原始数据集。（解压命令参考tar –xvf *.tar与 unzip *.zip）

本模型支持coco2017的val2017验证数据集，里面有5000张图片。用户可自行获取coco2017数据集中的annotations和val2017，上传数据集到服务器任意目录并解压（如：/home/HwHiAiUser/dataset），本模型将使用到coco2017数据集中的验证集及其标签文件instances_val2017.json, bbox_only_instances_val2017.json，标签文件bbox_only_instances_val2017.json是将coco2017中的原标签文件instances_val2017.json经过处理所得。数据目录结构请参考：
```
 ├── coco
 │    ├── val2017   
 │    ├── annotations
 │         ├──instances_val2017.json
```
数据预处理。
首先执行prepare-json.py脚本，得到bbox_only_instances_val2017.json文件
```
python3 prepare-json.py --keep-keys \
    ${data_path}/coco/annotations/instances_val2017.json \
    ${data_path}/coco/annotations/bbox_only_instances_val2017.json
```
参数说明:
- input_file: 位置参数，原始标签文件路径
- output_file: 位置参数，处理后新标签文件的保存路径
- -k, --keep-keys: 可选参数,保留原标签文件中无用的key
然后执行ssd_preprocess.py脚本，完成预处理。
```
python3 ssd_preprocess.py --data=${data_path}/coco --bin-output=./ssd_bin
```
参数说明：
- --data：数据集路径。
- --bin-output：预处理后的数据文件的相对路径。

模型推理

模型转换。

使用PyTorch将模型权重文件.pth转换为.onnx文件，再使用ATC工具将.onnx文件转为离线推理模型文件.om文件。
1. 获取权重文件。
从源码包中获取权重文件：“iter_183250.pt”和“resnet34-333f7ec4.pth”，对于pth权重文件，统一放在新建models文件夹下。
1. 导出onnx文件。
  1. 使用ssd_pth2onnx.py导出onnx文件。使用“resnet34-333f7ec4.pth”和“iter_183250.pt”导出onnx文件。运行“ssd_pth2onnx.py”脚本。
```
python3 ssd_pth2onnx.py --bs=1 \
    --resnet34-model=./models/resnet34-333f7ec4.pth \
    --pth-path=./models/iter_183250.pt \
    --onnx-path=./ssd_bs1.onnx
```
    参数说明：
    - --resnet34-model : resnet34 骨干网络权重路径
    - --pth-path: SSDResNet34权重路径
    - --onnx-path: onnx文件路径
    获得ssd_bs1.onnx文件（默认为动态导出）。
2. 使用ATC工具将ONNX模型转OM模型。
  1. 配置环境变量。
```
 source /usr/local/Ascend/ascend-toolkit/set_env.sh
```
    说明： 该脚本中环境变量仅供参考，请以实际安装环境配置环境变量。详细介绍请参见《CANN 开发辅助工具指南 (推理)》。
  2. 执行命令查看芯片名称ChipName。
```
npu-smi info
#该设备芯片名为Ascend310P3
回显如下：
+-------------------+-----------------+------------------------------------------------------+
| NPU     Name      | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device    | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===================+=================+======================================================+
| 0       310P3     | OK              | 15.8         42                0    / 0              |
| 0       0         | 0000:82:00.0    | 0            1074 / 21534                            |
+===================+=================+======================================================+
```
  3. 执行ATC命令。
```
atc --framework=5 \
    --model=./ssd_bs${bs}.onnx \
    --output=./ssd_bs${bs} \
    --input_format=NCHW \
    --input_shape="image:${bs},3,300,300" \
    --log=error \
    --soc_version=Ascend${ChipName}
```
    - 参数说明：
      - --model：为ONNX模型文件。
      - --framework：5代表ONNX模型。
      - --output：输出的OM模型。
      - --input_format：输入数据的格式。
      - --input_shape：输入数据的shape。
      - --log：日志级别。
      - --soc_version：处理器型号。
      命令中的${bs}表示模型的 batchsize, 比如设bs=1, 那么运行成功后将生成 ssd_bs1.om 模型文件。
开始推理验证。
1. 安装ais_bench推理工具。
请访问ais_bench推理工具代码仓，根据readme文档进行工具安装。
1. 执行推理。
```
python -m ais_bench \
    --model ${om_path}/ssd_bs1.om \
    --input /path/to/ssd_bin/ \
    --output ${out_path} \
    --output_dirname ${output_dirname} \
    --batchsize ${n}
```
- 参数说明：
  - --model：为.OM模型文件路径。
  - --input：为输入图片导出到二进制文件路径。
  - --output：模型推理结果存放的路径。
  - --output_dirname: 推理结果存放的子目录，位于--output指定的目录下。
  - --batchsize：输入batch size。
  推理后的输出在 ${out_path}目录下。
1. 精度验证。
调用“ssd_postprocess.py”评测模型的精度。
```
python ssd_postprocess.py --data=${data_path}/coco --bin-input=${output_path}
```
- 参数说明：
  - --bin-input：生成推理结果所在路径。
  - --data：数据集路径。

模型推理性能&精度

调用ACL接口推理计算，测出的性能模型精度如下：

Precision mAP

300I PRO精度 23.0%

Precision	mAP
300I PRO精度	23.0%

模型的性能指标如下：

Throughput	300I PRO	T4	300I PRO/T4
bs1	896.782	519	1.727
bs4	1395.545	694.444	2.010
bs8	1485.559	769.601	1.930
bs16	1509.467	794.715	1.899
bs32	1518.156	815.37	1.862
bs64	1024.644	820.019	1.250
最优batch	1518.156	820.019	1.851

公网地址说明

代码涉及公网地址参考 public_address_statement.md