HRnet-OCR

模型简介

  • 参考实现:
url=https:https://github.com/NVIDIA/semantic-segmentation
branch=master 
commit_id=7726b144c2cc0b8e09c67eabb78f027efdf3f0fa
  • 模型原理:HRnet-OCR模型为图像分割网络,通过将注意力机制和多尺度预测的方法结合,实现了更快速的训练模型并保持更高精度。

Requirements

  • CANN 5.0.3.1
  • torch 1.5.0+ascend.post3.20210930
  • apex 0.1+ascend.20210930
  • tensor-fused-plugin 0.1+ascend
  • te 0.4.0
  • python 3.7.5
  • runx 0.0.11
  • torchvision 0.6.0

配置数据集路径

采用Cityscapes数据集

参考源码仓的方式获取数据集:https://github.com/NVIDIA/semantic-segmentation

获取数据集后需按照源代码仓Download/Prepare Data指示配置数据集路径

配置预训练模型

预训练模型权重在作者源代码仓中均已给出,配置路径请参照源代码仓Download Weights进行配置

NPU 单卡训练命令

  • 训练(注:训练结束后模型将自动打印评估结果):
nohup bash test/train_full_1p.sh --data_path=./large_asset_dir/ &
  • 性能:
nohup bash test/train_performance_1p.sh --data_path=./large_asset_dir/ &

NPU 8卡训练命令

  • 训练(注:训练结束后模型将自动打印评估结果):
nohup bash test/train_full_8p.sh --data_path=./large_asset_dir/ &
  • 性能:
nohup bash test/train_performance_8p.sh --data_path=./large_asset_dir/ &

公网地址说明

代码涉及公网地址参考 public_address_statement.md