0

0

Lli_jing_hw!5221 【PyTorch】【built-in】HRnet-OCR、FFHQ_ID2978、HRNet_SEG、ICNet_ID1781、IntraDA模型公网地址整改

19050a54创建于 2023年7月17日历史提交

HRnet-OCR

模型简介

参考实现：

url=https:https://github.com/NVIDIA/semantic-segmentation
branch=master 
commit_id=7726b144c2cc0b8e09c67eabb78f027efdf3f0fa

模型原理：HRnet-OCR模型为图像分割网络，通过将注意力机制和多尺度预测的方法结合，实现了更快速的训练模型并保持更高精度。

Requirements

CANN 5.0.3.1
torch 1.5.0+ascend.post3.20210930
apex 0.1+ascend.20210930
tensor-fused-plugin 0.1+ascend
te 0.4.0
python 3.7.5
runx 0.0.11
torchvision 0.6.0

配置数据集路径

采用Cityscapes数据集

参考源码仓的方式获取数据集：https://github.com/NVIDIA/semantic-segmentation

获取数据集后需按照源代码仓Download/Prepare Data指示配置数据集路径

配置预训练模型

预训练模型权重在作者源代码仓中均已给出，配置路径请参照源代码仓Download Weights进行配置

NPU 单卡训练命令

训练（注：训练结束后模型将自动打印评估结果）：

nohup bash test/train_full_1p.sh --data_path=./large_asset_dir/ &

性能：

nohup bash test/train_performance_1p.sh --data_path=./large_asset_dir/ &

NPU 8卡训练命令

训练（注：训练结束后模型将自动打印评估结果）：

nohup bash test/train_full_8p.sh --data_path=./large_asset_dir/ &

性能：

nohup bash test/train_performance_8p.sh --data_path=./large_asset_dir/ &

公网地址说明

代码涉及公网地址参考 public_address_statement.md