ops-blas:基于 CANN 生态的高性能线性代数计算算子库项目

本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。

分支1Tags0
文件最后提交记录最后更新时间
add issue&PR template3 个月前
refactor(agent): 规范 Agent 工作流算子代码模板1 天前
refactor(blas): flatten directory structure and fix README files1 天前
docs(blaslt): relocate README files to source directories1 天前
fix: remove ops-tensor FP4 fallback types to avoid CANN 9.1.0 conflict6 小时前
refactor: 测试框架集成 Netlib BLAS/LAPACK,重构 6 个算子 golden 实现6 天前
修改scopy样例4 个月前
Feat: 新增面向arch35的aclblasSaxpy接口1 天前
refactor(agent): 规范 Agent 工作流算子代码模板1 天前
docs(blaslt): relocate README files to source directories1 天前
Docs:更新README、版本配套等文档信息1 个月前
refactor(agent): 规范 Agent 工作流算子代码模板1 天前
refactor: 统一头文件 include guard 为 #pragma once 并添加 CI lint 规则2 天前
Fix:add epilogue impl in blasLt9 天前
Refact:del common kernel launch header5 天前
add OAT & LICENSE & SECURITY rules3 个月前
quick_install资料问题修复1 个月前
Refact:重构算子目录结构为家族格式19 天前
add OAT & LICENSE & SECURITY rules3 个月前
Feat: 新增面向arch35的aclblasSspr接口2 天前
fix: install_deps.sh 支持 multiarch 路径检测 cblas.h5 天前
refine heuristic and kernel launch3 个月前

ops-blas

🔥Latest News

🚀概述

ops-blas是CANN (Compute Architecture for Neural Networks)算子库中提供高性能线性代数计算以及轻量化GEMM调用的算子库。

🛠️环境准备

环境部署是体验本项目能力的前提,请先完成NPU驱动、CANN包安装等,确保环境正常。

⬇️源码下载

环境准备好后,下载与CANN版本配套的分支源码,命令如下,${tag_version}替换为分支标签名。

说明:若环境中已存在配套分支源码,可跳过本步骤,例如CANNLab默认已提供最新商发版CANN对应的源码。

git clone -b ${tag_version} https://gitcode.com/cann/ops-blas.git

说明:对于CANNLab云开发环境,已默认提供最新商发CANN版本配套的源码,如需获取其他版本源码,参考上述命令获取。

📖学习教程

  • 快速入门:从零开始快速体验项目核心基础能力,涵盖源码编译、算子调用、开发与调试等操作。

💬相关信息

🤝联系我们

本项目功能和文档正在持续更新和完善中,建议您关注最新版本。

  • 问题反馈:通过GitCode【Issues】提交问题。
  • 社区互动:通过GitCode【讨论】参与交流。
  • 技术专栏:通过GitCode【Wiki】获取技术文章,如系列化教程、优秀实践等。

项目介绍

本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。

定制我的领域