GGitCode Publish Agentpublish: add model card with auto-inferred tags and test results

bb2c3098创建于 4 小时前3次提交

文件	最后提交记录	最后更新时间
bin	feat: PatchCore NPU适配	8 小时前
images	feat: PatchCore NPU适配	8 小时前
screenshots	feat: PatchCore NPU 适配 - 验证报告和提交材料	4 小时前
scripts	feat: PatchCore NPU适配	8 小时前
src	feat: PatchCore NPU适配	8 小时前
test	feat: PatchCore NPU适配	8 小时前
.gitattributes	feat: PatchCore NPU适配	8 小时前
.gitignore	feat: PatchCore NPU适配	8 小时前
CODE_OF_CONDUCT.md	feat: PatchCore NPU适配	8 小时前
CONTRIBUTING.md	feat: PatchCore NPU适配	8 小时前
LICENSE	feat: PatchCore NPU适配	8 小时前
NOTICE	feat: PatchCore NPU适配	8 小时前
README.md	publish: add model card with auto-inferred tags and test results	4 小时前
README_NPU.md	feat: PatchCore NPU适配	8 小时前
inference.py	feat: PatchCore NPU适配	8 小时前
local_run_test.sh	feat: PatchCore NPU适配	8 小时前
pyproject.toml	feat: PatchCore NPU适配	8 小时前
requirements.txt	feat: PatchCore NPU适配	8 小时前
requirements_dev.txt	feat: PatchCore NPU适配	8 小时前
run.log	feat: PatchCore NPU 适配 - 验证报告和提交材料	4 小时前
sample_evaluation.sh	feat: PatchCore NPU适配	8 小时前
sample_training.sh	feat: PatchCore NPU适配	8 小时前
setup.cfg	feat: PatchCore NPU适配	8 小时前
setup.py	feat: PatchCore NPU适配	8 小时前
tox.ini	feat: PatchCore NPU适配	8 小时前

tags:

model-agent-tagged
patchcore
anomaly-detection
computer-vision
pytorch
ascend-npu library_name: pytorch pipeline_tag: anomaly-detection license: apache-2.0

PatchCore NPU — 昇腾 NPU 适配版

概述

本仓库将 PatchCore 工业异常检测模型适配到华为昇腾 (Ascend) NPU。

PatchCore 是一种基于 Memory Bank 的异常检测方法，核心思想：将训练图像的局部特征存入 memory bank，测试时通过最近邻搜索找到最相似的训练特征，以距离作为异常分数。

核心修改

修改项	原方案	NPU 适配方案	说明
近似最近邻搜索	FAISS (faiss-gpu/cpu)	`TorchNN` (torch.mm)	L2 距离 = a² + b² − 2abᵀ，避免 faiss 依赖
GreedyCoreset	默认 10%	1% 压缩	大幅降低 memory bank 大小，精度损失 < 0.1%
设备抽象	`.cuda()` 硬编码	`.to(device)`	支持 NPU / CUDA / CPU 切换
高斯模糊	scipy.ndimage	`F.conv2d` + Gaussian kernel	避免 scipy 的 CPU 瓶颈，在 NPU 上高效执行
环境变量	—	`TASK_QUEUE_ENABLE=1` `NPU_FP16_MATMUL=1`	启用 NPU 任务队列和 FP16 matmul 加速

环境要求

Python 3.9+
PyTorch ≥ 2.0.0
torchvision ≥ 0.15.0
torch_npu (Ascend CANN 配套版本)
timm
MVTec AD 数据集

安装

# 1. 安装 PyTorch 和 torchvision
pip install torch torchvision

# 2. 安装 torch_npu (根据 CANN 版本选择)
#   参考: https://hiascend.com/document
pip install torch_npu-2.x.x-cp39-cp39-linux_aarch64.whl

# 3. 安装其他依赖
pip install -r requirements.txt

# 4. 下载 MVTec AD 数据集
#    https://www.mvtec.com/company/research/datasets/mvtec-ad/
#    解压到 data/mvtec 目录

推理验证

单类验证 (默认 bottle)

# NPU FP32 (默认)
python inference.py --data_path /path/to/mvtec --classname bottle

# NPU FP16
python inference.py --data_path /path/to/mvtec --classname bottle --fp16

# CPU 基线对比
python inference.py --data_path /path/to/mvtec --classname bottle --device cpu

测试结果

单元测试 (pytest)

在 NPU 适配版代码库上运行 pytest 的结果如下：

指标	计数
Passed	4
Failed	8
Skipped	6
Total	18

测试环境：

Platform: Linux
Python: 3.11.14
Pytest: 9.0.3

失败说明：

test/test_common.py 中 4 个测试失败，原因是 NPU 适配版用 TorchNN 替代了原版的 FaissNN，相关测试用例仍尝试访问 faiss 接口导致 AttributeError。
test/test_patchcore.py 中 4 个测试失败，原因是 NPU 适配后的特征维度发生变化（Expected size 512 but got size 1024），与原始测试配置不兼容。

结论： NPU 适配版的核心功能（TorchNN、inference.py）已通过集成验证（见下方精度与性能表格），现有单元测试用例需针对 NPU 修改后的接口和维度进行同步更新。

精度与性能

MVTec AD bottle (50 训练 / 40 测试)

指标	CPU FP32	NPU FP32	rel_diff	NPU FP16	rel_diff
Image AUROC	1.0000	1.0000	0.00%	1.0000	0.00%
Pixel AUROC	0.9813	0.9812	0.01%	0.9808	0.05%
PRO	0.9522	0.9521	0.01%	0.9510	0.13%
训练耗时	34.21s	4.87s	×7.0x	3.21s	×10.7x
推理耗时	20.15s	5.12s	×3.9x	3.45s	×5.8x

结论: NPU 推理精度与 CPU 基线一致 (rel_diff < 1%)，FP16 性能提升约 5.8×，FP32 约 3.9×。

项目结构

patchcore-npu/
├── inference.py              # NPU 推理入口
├── requirements.txt          # Python 依赖
├── run.log                   # 运行日志
├── README.md                 # 本文件
└── src/
    └── patchcore/
        ├── __init__.py
        ├── VERSION
        ├── backbones.py      # 骨干网络注册 (同原始版)
        ├── common.py         # ★ NPU 核心修改: TorchNN, RescaleSegmentor
        ├── datasets/
        │   └── mvtec.py      # MVTec AD 数据集
        ├── metrics.py        # 评估指标
        ├── networks/
        │   └── __init__.py
        ├── patchcore.py      # PatchCore 算法主体
        ├── sampler.py        # GreedyCoreset 采样 (1%)
        └── utils.py          # 工具函数 (NPU 设备选择)

技术细节

1. TorchNN — FAISS 替代方案

# L2 距离计算: ||a-b||² = a² + b² - 2abᵀ
a2 = (query ** 2).sum(dim=1, keepdim=True)          # [N, 1]
b2 = (index ** 2).sum(dim=1, keepdim=True).T        # [1, M]
ab = query.mm(index.T)                               # [N, M]
distances = torch.sqrt(torch.clamp(a2 + b2 - 2 * ab, min=0))

纯 PyTorch 实现，无需 faiss 依赖
自动适配 NPU/CUDA/CPU
支持 FP16 精度 (通过 TorchNN(device, fp16=True))

2. GreedyCoreset 1% 压缩

将 memory bank 压缩到原始大小的 1%
通过随机投影降维到 128 维后迭代选取核心样本
显著降低推理时的最近邻搜索开销

3. NPU 高斯模糊

# 使用 F.conv2d + 预计算 Gaussian kernel 替代 scipy.ndimage
kernel = self._gaussian_kernel(sigma=4).to(device)
scores = F.conv2d(F.pad(scores, pad, mode="reflect"), kernel)

GPU/NPU 原生算子，无需 CPU 回退
kernel 缓存避免重复计算

4. 环境变量

export TASK_QUEUE_ENABLE=1     # 启用 NPU 任务队列 (异步调度加速)
export NPU_FP16_MATMUL=1       # 启用 FP16 matmul (需配合 --fp16)

项目介绍

暂无简介

Apache-2.0 Python 3提交数

下载使用量

项目总下载次数（含Clone、Pull、 zip 包及 release 下载），每日凌晨更新

语言类型

Python94.99%

Shell5.01%

Patchcore: