kudnn

文件	最后提交记录	最后更新时间
build	添加pre-commit Co-authored-by: yangxf9911<yangxf999@foxmail.com>	1 个月前
src	AI扫描安全问题处理：int32溢出风险	15 天前
test	添加pre-commit Co-authored-by: yangxf9911<yangxf999@foxmail.com>	1 个月前
.clang-format	添加pre-commit Co-authored-by: yangxf9911<yangxf999@foxmail.com>	1 个月前
.gitignore	添加pre-commit Co-authored-by: yangxf9911<yangxf999@foxmail.com>	1 个月前
.pre-commit-config.yaml	添加pre-commit Co-authored-by: yangxf9911<yangxf999@foxmail.com>	1 个月前
LICENSE	添加pre-commit Co-authored-by: yangxf9911<yangxf999@foxmail.com>	1 个月前
README.md	添加国内镜像googletest	21 天前
README_en.md	添加国内镜像googletest	21 天前

KuDNN

🔥release-notes

[2026/03] KuDNN首次上线，支持linear、softmax和normal等算子，使用KML BLAS高性能库和JIT动态代码生成kernel作为底层计算方法

🚀概述

KuDNN鲲鹏深度神经网络算子库，结合鲲鹏CPU微架构特性与软优化手段，优化AI算子性能。KuDNN可以通过算子库插件形式集成进开源软件oneDNN框架，也可以单独作为后端加速算子集成到TensorFlow或者Pytorch。

📝版本配套

运行平台
- 鲲鹏 920 专业版
系统规格
- openEuler 20.03（LTS-SP3）AArch64
- openEuler 22.03（LTS-SP2）AArch64
- openEuler 22.03（LTS-SP3）AArch64
- openEuler 22.03（LTS-SP4）AArch64
- openEuler 24.03（LTS-SP3）AArch64

⚡️编译安装与测试

1. 获取 HPCKit 软件包

下载 HPCKit 软件包（HPCKit 版本号根据实际情况调整）

wget https://mirrors.huaweicloud.com/kunpeng/archive/HPC/HPCKit/HPCKit_26.0.RC1_Linux-aarch64.tar.gz

2. 安装 HPCKit

解压 HPCKit 软件包（HPCKit 版本号根据实际情况调整）

tar xvf HPCKit_26.0.RC1_Linux-aarch64.tar.gz

安装 HPCKit

sh HPCKit_26.0.RC1_Linux-aarch64/install.sh -y --prefix=[HPCKit安装目录]

3. KuDNN编译安装

KuDNN依赖Bisheng/GCC编译器、KML BLAS和KUPL，需要预先加载，具体版本号根据HPCKit实际情况调整。这里以26.0.RC1版本HPCKit为例。

(1) Bisheng编译KuDNN

加载 module

module use [HPCKit安装目录]/HPCKit/latest/modulefiles   #添加HPCkit到MODULEPATH环境变量
module avail                                            #查看HPCKit各组件名称

加载编译器环境变量

module load bisheng/compiler5.1.0/bishengmodule #加载Bisheng编译器，版本号根据实际情况调整

加载KML BLAS和KUPL环境变量

module load bisheng/kml26.0.RC1/kblas/multi     #加载KML BLAS
module load bisheng/kupl26.0.RC1/release        #加载Kupl

编译KuDNN

上传并解压 KuDNN 项目源码包（分支名根据实际情况调整）

unzip kudnn-main.zip

进入KuDNN项目源码根目录（分支名根据实际情况调整）

cd kudnn-main

执行如下命令

sh build/build_kudnn.sh --only_kudnn=on --build_type=Release --compiler=clang --install_path=[KuDNN安装目录]
# --only_kudnn=on 表示只编译kudnn，不编译测试程序
# --compiler=clang 表示指定Bisheng编译器
# --install_path 指定kudnn安装目录

(2) GCC编译KuDNN

加载 module

module use [HPCKit安装目录]/HPCKit/latest/modulefiles   #添加HPCkit到MODULEPATH环境变量
module avail                                            #查看HPCKit各组件名称

加载编译器环境变量

module load gcc/compiler12.3.1/gccmodule    #加载gcc编译器，版本号根据实际情况调整

加载KML BLAS和KUPL环境变量

module load gcc/kml26.0.RC1/kblas/multi     #加载KML BLAS
module load gcc/kupl26.0.RC1/release        #加载Kupl

编译KuDNN

上传并解压 KuDNN 项目源码包（分支名根据实际情况调整）

unzip kudnn-main.zip

进入KuDNN项目源码根目录（分支名根据实际情况调整）

cd kudnn-main

执行如下命令

sh build/build_kudnn.sh --only_kudnn=on --build_type=Release --compiler=gcc --install_path=[KuDNN安装目录]
# --only_kudnn=on 表示只编译kudnn，不编译测试程序
# --compiler=gcc 表示指定gcc编译器
# --install_path 指定kudnn安装目录

4. 测试

(1) 编译测试程序

KuDNN的gtest测试程序依赖googletest，进入KuDNN根目录执行脚本下载安装googletest。

sh build/pre_env_kudnn.sh

如果pre_env_kudnn.sh脚本因网络问题下载googletest失败，可手动下载googletest，如无法访问github可访问国内镜像googletest。如果下载的googletest根目录带有后缀名，需重命名为不带后缀的googletest，再上传至KuDNN根目录的opensource/路径下。最后执行如下命令跳过下载直接开始构建。

sh build/pre_env_kudnn_compile.sh

安装完成后会在opensource/install/googletest/lib64下生成gtest相关库

libgmock.a  libgmock_main.a  libgtest.a  libgtest_main.a

在kudnn编译完成的基础上，编译测试程序，测试程序只支持在Bisheng编译KuDNN的基础上编译。

sh build/build_kudnn.sh --only_tests=on --compiler=clang --install_path=[KuDNN安装目录]
# --only_test=on 表示只编译测试程序
# --compiler=clang 测试程序只支持Bisheng编译器
# --install_path 指示kudnn安装目录位置

生成的测试程序kudnn_gtest位于out/test/dnn/llt/gtest。

Tips：如何用kudnn_gtest测试GCC版KuDNN？

Bisheng编译好KuDNN和测试程序后，重新用GCC编译KuDNN，kudnn_gtest的动态链接库就会指向新编译的GCC版KuDNN，即可继续测试。

sh build/build_kudnn.sh --only_kudnn=on --build_type=Release --compiler=clang --install_path=[KuDNN安装目录]

(2) 运行测试程序

进入out/test/dnn/llt/gtest目录，有测试程序kudnn_gtest，可用于测试指定用例，例如

./kudnn_gtest --gtest_filter=LinearActivationTests.FWD_LINEAR_RELU_2D_FP32 #测试float32数据类型的linear 2D接口

得到结果

Note: Google Test filter = LinearActivationTests.FWD_LINEAR_RELU_2D_FP32
[==========] Running 1 test from 1 test suite.
[----------] Global test environment set-up.
[----------] 1 test from LinearActivationTests
[ RUN      ] LinearActivationTests.FWD_LINEAR_RELU_2D_FP32
[       OK ] LinearActivationTests.FWD_LINEAR_RELU_2D_FP32 (84 ms)
[----------] 1 test from LinearActivationTests (84 ms total)

[----------] Global test environment tear-down
[==========] 1 test from 1 test suite ran. (85 ms total)
[  PASSED  ] 1 test.

查看全部测试用例

./kudnn_gtest --gtest_list_tests

更多用法详见

./kudnn_gtest --help

📖学习教程

算子说明

KuDNN目前支持的算子如表 KuDNN支持的算子如下所示。

算子名称	算子说明
GEMM & Linear	矩阵乘法算子
Linear+postops	在Linear算子计算后进行relu、silu、gelu、resext、resmul及residential等操作
Softmax	Softmax归一化算子
Conv2d/Conv3d	2d/3d卷积算子
Group Normalization	组归一化算子
Layer Normalization	层归一化算子
Embedding	映射
Root Mean Square Normalization	均方根归一化算子
Rotary Position Embedding	旋转位置编码

更多学习教程见KuDNN开发指南。

KuDNN开发指南: 详细介绍了KuDNN的接口定义、使用说明和代码样例。

🔍目录结构

kuDNN/
├── build/
│  ├── build_kudnn.sh              # kudnn编译脚本
│  ├── pre_env_kudnn_compile.sh    # 测试程序依赖库Googletest编译脚本
|  └── pre_env_kudnn.sh            # 测试程序依赖库Googletest下载和编译脚本
├── src/dnn/
│  ├── include/                  # 头文件
│  └── src/                      # kudnn库源码
└── test/dnn/llt/gtest
   ├── cmake/                    # 测试程序cmake编译配置
   └── src/                      # 测试程序源码

🤝联系我们

本项目功能和文档正在持续更新和完善中，建议您关注最新版本。

问题反馈：通过【Issues】提交问题。
社区互动：通过【鲲鹏论坛（HPC专区）】参与交流。
技术专栏：通过【鲲鹏社区】获取技术文章，如系列化教程、优秀实践等。

项目介绍

kudnn

MulanPSL-2.0 C++19提交数

定制我的领域

README

规则集

kudnn:kudnn

KuDNN

🔥release-notes

🚀概述

📝版本配套

⚡️编译安装与测试

1. 获取 HPCKit 软件包

下载 HPCKit 软件包（HPCKit 版本号根据实际情况调整）

2. 安装 HPCKit

解压 HPCKit 软件包（HPCKit 版本号根据实际情况调整）

安装 HPCKit

3. KuDNN编译安装

(1) Bisheng编译KuDNN

加载 module

加载编译器环境变量

加载KML BLAS和KUPL环境变量

编译KuDNN

(2) GCC编译KuDNN

加载 module

加载编译器环境变量

加载KML BLAS和KUPL环境变量

编译KuDNN

4. 测试

(1) 编译测试程序

Tips：如何用kudnn_gtest测试GCC版KuDNN？

(2) 运行测试程序

📖学习教程

算子说明

🔍目录结构

🤝联系我们

项目介绍