文件最后提交记录最后更新时间
【task】更新license Co-authored-by: yuantao<taoyuan15@h-partners.com> # message auto-generated for no-merge-commit merge: !399 merge master into master 【task】更新license Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!3995 个月前
样例34的简洁说明 Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !377 merge br_doc_34_update into master 样例34的简洁说明 Created-by: init__zhb__ Commit-by: init__zhb__ Merged-by: turing_project1 Description: ## 描述 文档更新,针对34_single_core_splitk样例创建说明文档。 ## 关联的Issue ## 原因 ## 测试 ## 文档更新 涉及的补充文档[A]: docs/contents/example_design/34_single_splitk_matmul.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!3775 个月前
【task】更新license Co-authored-by: yuantao<taoyuan15@h-partners.com> # message auto-generated for no-merge-commit merge: !399 merge master into master 【task】更新license Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!3995 个月前
README.md

SingleSplitK_Matmul Example Readme

功能说明

参数说明

本样例直调参数包括m, n, k, deviceId,与00_basic_matmul参数条件一致。 相应地,算子原型有如下设计:

名称/Name 类型/Class 数据类型/Dtype 维度/Dims 格式/Format 描述/Description
matA inTensor fp16|bf16|fp32 [m, k] ND|NZ 左矩阵,支持转置
matB inTensor fp16|bf16|fp32 [k, n] ND|NZ 右矩阵,支持转置
matC outTensor fp16|bf16|fp32 [m, n] ND 输出矩阵

约束说明

代码组织

本样例组织结构如下:

├── 34_single_splitk_matmul
│   ├── CMakeLists.txt           # CMake编译文件
│   ├── single_core_splitk.cpp   # 主文件
│   └── README.md                

使用示例

  1. 编译样例代码,并编译生成相应的算子可执行文件。
# 编译指定用例
bash scripts/build.sh 34_single_core_splitk_matmul
  1. 切换到可执行文件的编译目录output/bin下,并执行算子样例程序。类似于基础样例00_basic_matmul,测试数据根据命令行输入尺寸随机生成。
cd output/bin
# 可执行文件名 |矩阵m轴|n轴|k轴|Device ID
# Device ID可选,默认为0
./34_single_core_splitk_matmul 256 512 1024 0

• 256:矩阵m轴

• 512:n轴

• 1024:k轴

• 0:Device ID,可选,默认为0

执行结果如下,说明精度比对成功。

Compare success.