6f5ac996创建于 2025年11月13日历史提交

文件	最后提交记录	最后更新时间
LICENSE	!111 yolov7 !111 yolov7	3 年前
README.md	!357 yolov8推理readme依赖更新，对齐训练版本 Merge pull request !357 from 苏宇轩/master	7 个月前
aipp.cfg	!111 yolov7 !111 yolov7	3 年前
atc.sh	!145 yolov7模型整改 !145 yolov7模型整改	3 年前
modelzoo_level.txt	!145 yolov7模型整改 !145 yolov7模型整改	3 年前
om_nms_acc.py	!346 YOLO7 完善说明文档 Merge pull request !346 from niushiya/master	1 年前
requirements.txt	!111 yolov7 !111 yolov7	3 年前

YOLOv7-推理指导

YOLOv7-推理指导
概述
推理环境准备
快速上手
模型推理性能&精度

概述

YOLOv7是yolo系列目标检测网络，在5 FPS到160 FPS范围内的速度和精度达到了新的高度，并在GPU V100上具有30 FPS或更高的所有已知实时目标检测器中具有最高的精度56.8%AP。

本模型支持的任务类型
目标检测

版本说明：
本代码仓基于yolov7-main，其他tag可以参考该流程。
```
url=https://github.com/WongKinYiu/yolov7
tag=main
model_name=yolov7
```

推理环境准备

该模型需要以下插件与驱动
表 1 版本配套表

配套	版本	环境准备指导
固件与驱动	22.0.3	Pytorch框架推理环境准备
CANN	6.0.0	-
Python	3.7.5	-
PyTorch	1.8.0	-
说明：Atlas 300I Duo 推理卡请以CANN版本选择实际固件与驱动版本。	\	\

快速上手

获取源码

获取Pytorch源码

git clone https://github.com/WongKinYiu/yolov7.git
cd yolov7
mkdir output     # 新建output文件夹，作为模型结果的默认保存路径

安装依赖
```
pip3.7 install -r requirements.txt
```

获取OM推理代码
将推理部署代码放到Pytorch源码相应目录下。

YOLOv7_for_PyTorch
├── aipp.cfg   放到yolov7下
├── atc.sh     放到yolov7下
└── om_nms_acc.py  放到yolov7下

准备数据集

该模型使用coco2017 val数据集进行精度评估，在Pytorch源码根目录下新建coco文件夹，数据集放到coco里，文件结构如下：

coco
├── images
|    ├── val2017
|        ├── 00000000139.jpg
|        ├── 00000000285.jpg
|         ……
|        └── 00000581781.jpg
|    
└── annotations
     └── instances_val2017.json

模型推理

1 模型转换

将模型权重文件.pt转换为.onnx文件，再使用ATC工具将.onnx文件转为离线推理模型.om文件。

获取权重文件
下载YOLOv7权重文件或使用下述命令下载。
```
wget https://github.com/WongKinYiu/yolov7/releases/download/v0.1/yolov7x.pt
```
获得yolov7x.pt文件
导出ONNX模型
运行export.py导出ONNX模型，--dynamic-batch支持导出动态batch的ONNX，--simplify简化导出的ONNX。
```
python3.7 export.py --weights=yolov7x.pt --grid --img-size=640 --dynamic-batch --simplify
```
获得yolov7x.onnx文件

使用ATC工具将ONNX模型转OM模型
3.1 配置环境变量

source /usr/local/Ascend/ascend-toolkit/set_env.sh

说明：
该脚本中环境变量仅供参考，请以实际安装环境配置环境变量。详细介绍请参见《CANN 开发辅助工具指南 (推理)》。

3.2 执行命令查看芯片名称（${soc_version}）

npu-smi info
#该设备芯片名为Ascend310P3 （自行替换）
回显如下：
+-------------------+-----------------+------------------------------------------------------+
| NPU     Name      | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device    | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===================+=================+======================================================+
| 0       310P3     | OK              | 15.8         42                0    / 0              |
| 0       0         | 0000:82:00.0    | 0            1074 / 21534                            |
+===================+=================+======================================================+
| 1       310P3     | OK              | 15.4         43                0    / 0              |
| 0       1         | 0000:89:00.0    | 0            1070 / 21534                            |
+===================+=================+======================================================+

3.3 执行ATC命令
运行atc.sh导出OM模型，默认保存在output文件夹下。

# 导出batchsize=8的om模型，若需导出其他batchsize的om模型，直接修改输入shape（第三个参数 8）即可。
bash atc.sh yolov7x.onnx yolov7x_bs8 8 Ascend310P3

atc命令参数说明（参数见atc.sh）：
- --framework: 5代表ONNX模型
- --model: ONNX模型文件
- --output: 输出的OM模型
- --input_format: 输入数据的格式
- --input_shape: 输入数据的shape
- --log: 日志级别
- --soc_version: 处理器型号
- --insert_op_conf: aipp配置文件
- --optypelist_for_implmode: 设置optype列表中算子的实现方式。该参数需要与--op_select_implmode参数配合使用。
- --op_select_implmode: 设置网络模型中所有算子是高精度实现还是高性能实现。高精度是指在fp16输入的情况下，通过泰勒展开/牛顿迭代等手段进一步提升算子的精度；高性能是指在fp16输入的情况下，不影响网络精度前提的最优性能实现。

使用aipp进行预处理 aipp功能的开启需要在atc工具转换的过程中通过选项--insert_op_conf=xxx.config添加配置文件。AIPP配置可以参考CANN 5.0.1 开发辅助工具指南 (推理) 01，本文案例配置文件示例aipp.cfg：

aipp_op{
   aipp_mode : static
   input_format : RGB888_U8
   src_image_size_w : 640 
   src_image_size_h : 640
   
   csc_switch : false
   rbuv_swap_switch : false

   crop: false
   load_start_pos_h : 0
   load_start_pos_w : 0
   crop_size_w : 640
   crop_size_h : 640
   
   //均值 : 255x[0, 0, 0], 方差 : 1/(255x[1, 1, 1])
   min_chn_0 : 0
   min_chn_1 : 0
   min_chn_2 : 0
   var_reci_chn_0: 0.0039215686274509803921568627451
   var_reci_chn_1: 0.0039215686274509803921568627451
   var_reci_chn_2: 0.0039215686274509803921568627451

}

3 开始推理验证

安装ais_bench推理工具
ais_bench工具获取及使用方式请点击查看[ais_bench 推理工具使用文档]
执行推理
运行om_nms_acc.py推理OM模型，结果默认保存在output/predictions.json，可设置参数--eval计算mAP，--visible将检测结果显示到图片。
```
python3.7 om_nms_acc.py --model=yolov7x_bs8.om --output=output --batch=8 --conf-thres=0.001 --iou-thres=0.65 --device=0 --eval
```
性能验证
可使用ais_bench推理工具的纯推理模式验证不同batchsize的OM模型的性能，参考命令如下：
```
python3.7 -m ais_bench --model=yolov7x_bs8.om --output=output --batchsize=8 --device=0 --loop=1000 
```

模型推理性能&精度

调用ACL接口推理计算，性能&精度参考下列数据。

	mAP	300I PRO	T4	300I PRO/T4
bs1	0.525	133.632	71.508	1.87
bs4	0.525	144.010	92.083	1.56
bs8	0.525	147.187	89.986	1.64
bs16	0.525	145.478	88.409	1.65
bs32	0.525	123.214	82.898	1.49
bs64	0.525	115.592	73.922	1.56
最优bs	0.525	147.187	92.083	1.60