7ea8f2f9创建于 2024年11月28日历史提交

文件	最后提交记录	最后更新时间
LICENSE	init	4 年前
README.md	!6851 [Clean Code] 修改芯片型号描述 Merge pull request !6851 from 施康/master	1 年前
Retinanet.diff	!2351 [自研][PyTorch离线推理][cv][PAMTRI&vovnet39&retinanet] 代码及资料整改 * bugfix * Modify PAMTRI&vovnet39&retinanet code and documentation	3 年前
Retinanet_postprocess.py	!2351 [自研][PyTorch离线推理][cv][PAMTRI&vovnet39&retinanet] 代码及资料整改 * bugfix * Modify PAMTRI&vovnet39&retinanet code and documentation	3 年前
Retinanet_preprocess.py	!2351 [自研][PyTorch离线推理][cv][PAMTRI&vovnet39&retinanet] 代码及资料整改 * bugfix * Modify PAMTRI&vovnet39&retinanet code and documentation	3 年前
get_info.py	init	4 年前
modelzoo_level.txt	init	4 年前
requirements.txt	update retinanet	3 年前

RetinaNet模型-推理指导

概述
- 输入输出数据
推理环境准备
快速上手
模型推理性能&精度

概述

论文提出了一个简单、灵活、通用的损失函数Focal loss，用于解决单阶段目标检测网络检测精度不如双阶段网络的问题。这个损失函数是针对了难易样本训练和正负样本失衡所提出的，使得单阶段网络在运行快速的情况下，获得与双阶段检测网络相当的检测精度。此外作者还提出了一个Retinanet用于检验网络的有效性，其中使用Resnet和FPN用于提取多尺度的特征。

参考实现：

url=https://github.com/facebookresearch/detectron2
commit_id=60fd4885d7cfd52d4267d1da9ebb6b2b9a3fc937
code_path=detectron2
model_name=detectron2

输入输出数据

输入数据

输入数据数据类型大小数据排布格式

input FP32 1 x 3 x 224 x 224 NCHW
输出数据

输出数据数据类型大小数据排布格式

boxes FLOAT32 5 x 100 ND

labels INT64 1 x 100 ND

输入数据	数据类型	大小	数据排布格式
input	FP32	1 x 3 x 224 x 224	NCHW

输出数据	数据类型	大小	数据排布格式
boxes	FLOAT32	5 x 100	ND
labels	INT64	1 x 100	ND

推理环境准备

该模型需要以下插件与驱动

表 1 版本配套表

配套版本环境准备指导

固件与驱动 22.0.2 Pytorch框架推理环境准备

CANN 5.1.RC2 -

Python 3.7.5 -

配套	版本	环境准备指导
固件与驱动	22.0.2	Pytorch框架推理环境准备
CANN	5.1.RC2	-
Python	3.7.5	-

快速上手

获取源码

获取源码。

git clone https://github.com/facebookresearch/detectron2 -b main
cd detectron2
git reset --hard 60fd4885d7cfd52d4267d1da9ebb6b2b9a3fc937
patch -p1 < ../Retinanet.diff
pip install -e .
cd -

安装依赖。
```
pip3 install -r requirements.txt
```

准备数据集

获取原始数据集。

本模型需要coco2017数据集，数据集下载地址

受开源代码仓的限制，建议把coco数据集存放在 detectron2/datasets 目录下，并设置环境变量 export DETECTRON2_DATASETS=detectron2/datasets。

其中val2017目录存放coco数据集的验证集图片，annotations目录存放coco数据集的instances_val2017.json，文件目录结构如下：
```
 detectron2
 ├── datasets
 │   ├── coco
 │   │   ├── annotations
 │   │   ├── val2017
```
数据预处理，将原始数据集转换为模型输入的数据。

运行数据预处理脚本，将原始数据转换为符合模型输入要求的bin文件。
```
python Retinanet_preprocess.py \
       --image_src_path=detectron2/datasets/coco/val2017 \
       --bin_file_path=val2017_bin \
       --model_input_height=1344 \
       --model_input_width=1344
```
- 参数说明：
  - --image_src_path：原始数据验证集（.jpg）所在路径。
  - --bin_file_path：输出的二进制文件（.bin）所在路径。
  - --model_input_height：模型输入图像高度像素数量。
  - --model_input_width：模型输入图像宽度像素数量。
运行成功后，会在当前目录下生成二进制文件。

模型推理

模型转换。

使用PyTorch将模型权重文件.pth转换为.onnx文件，再使用ATC工具将.onnx文件转为离线推理模型文件.om文件。

获取权重文件。

RetinaNet-detectron2.pkl

导出onnx文件。

python detectron2/tools/deploy/export_model.py \
      --config-file detectron2/configs/COCO-Detection/retinanet_R_50_FPN_3x.yaml \
      --output ./ \
      --export-method tracing \
      --format onnx MODEL.WEIGHTS RetinaNet-detectron2.pkl MODEL.DEVICE cpu

获得model.onnx文件。

使用ATC工具将ONNX模型转OM模型。

配置环境变量。

source /usr/local/Ascend/ascend-toolkit/set_env.sh

执行命令查看芯片名称（${chip_name}）。

npu-smi info
#该设备芯片名为Ascend310P3 （自行替换）
回显如下：
+-------------------+-----------------+------------------------------------------------------+
| NPU     Name      | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device    | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===================+=================+======================================================+
| 0       310P3     | OK              | 15.8         42                0    / 0              |
| 0       0         | 0000:82:00.0    | 0            1074 / 21534                            |
+===================+=================+======================================================+
| 1       310P3     | OK              | 15.4         43                0    / 0              |
| 0       1         | 0000:89:00.0    | 0            1070 / 21534                            |
+===================+=================+======================================================+

执行ATC命令。

batch_size=1             # 本文仅以batch_size=1为例进行说明
atc --model=model.onnx \
   --framework=5 \
   --output=retinanet_bs${batch_size} \
   --input_format=NCHW \
   --input_shape="input0:$batch_size,3,1344,1344" \
   --out_nodes="Cast_1229:0;Reshape_1223:0;Gather_1231:0" \
   --log=error \
   --soc_version=Ascend${chip_name}

参数说明：
- --model: ONNX模型文件所在路径。
- --framework: 5 代表ONNX模型。
- --input_format: 输入数据的排布格式。
- --input_shape: 输入数据的shape。
- --output: 生成OM模型的保存路径。
- --log: 日志级别。
- --soc_version: 处理器型号。

运行成功后生成 retinanet_bs1.om 模型文件。

开始推理验证。
1. 安装ais_bench推理工具。
  
  请访问ais_bench推理工具代码仓，根据readme文档进行工具安装。
2. 执行推理。
```
python -m ais_bench \
      --model ./retinanet_bs1.om \
      --input ./val2017_bin \
      --output ./ \
      --output_dirname result \
      --batchsize 1 \
      --outfmt BIN
```
  - 参数说明：
    - --model: OM模型路径。
    - --input: 存放预处理bin文件的目录路径
    - --output: 存放推理结果的目录路径
    - --output_dirname: 存放推理结果文件夹
    - --batchsize：每次输入模型的样本数
    - --outfmt: 推理结果数据的格式
    推理后的输出默认在当前目录result下。
3. 精度验证。
  
  说明：精度验证之前，将推理结果文件中summary.json删除运行get_info.py脚本，生成图片数据info文件。
```
 python get_info.py jpg ./datasets/coco/val2017 val2017.info
```
  - 参数说明：
    - 第一个参数为生成的数据集文件格式
    - 第二个参数为原始数据文件相对路径
    - 第三个参数为生成的info文件名
  运行成功后，在当前目录生成val2017.info，执行后处理脚本，计算 map 精度：
```
python Retinanet_postprocess.py \
      --bin_data_path=./result/ \
      --val2017_path=./datasets/coco \
      --test_annotation=val2017.info \
      --det_results_path=./ret_npuinfer/ \
      --net_out_num=3 \
      --net_input_height=1344 \
      --net_input_width=1344
```
  - 参数说明：
    - --bin_data_path: 推理结果所在路径
    - --val2017_path: 数据集所在路径
    - --test_annotation: 原始图片信息文件
    - --det_results_path: 后处理输出结果
    - --net_out_num: 网络输出个数
    - --net_input_height: 网络高
    - --net_input_width: 网络宽
4. 性能验证。
  
  可使用ais_bench推理工具的纯推理模式验证不同batch_size的om模型的性能，参考命令如下：
```
python -m ais_bench --model retinanet_bs1.om --loop 20 --batchsize 1
```
  -参数说明：
  - --model: om模型
  - --batchsize: 每次输入模型样本数
  - --loop: 循环次数

模型推理性能&精度

调用ACL接口推理计算，性能参考下列数据。

精度对比

Model batchsize Accuracy 开源仓精度

Retinanet 1 map = 38.3% map = 38.6%
性能对比

batchsize 300I PRO 性能 A500 A2 性能

1 17 3.84