文件最后提交记录最后更新时间
[Profiling]新增Profiling样例torch核函数中上报Shape信息 Co-authored-by: z00622916<zhengkai40@huawei.com> # message auto-generated for no-merge-commit merge: !1242 merge profiling-example into 9.0.0 [Profiling]新增Profiling样例torch核函数中上报Shape信息 Created-by: z296249221 Commit-by: z00622916 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增examples\01_simd_cpp_api\01_utilities\04_profiling\torch_library_report_tensor样例,展示了通过<<<>>>内核调用符调用核函数时,如何集成Profiling并采集Add算子的Shape信息。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #xxx--> NA ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 参考README.md,验证采集的数据结果。 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> NA ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 fix: Bug 修复 - [x] ✨ feat: 新功能 - [ ] ⚡ perf: 性能优化 - [ ] ♻️ refactor: 代码重构 - [ ] 🧪 test: 新增或修改测试 - [ ] 📝 docs: 文档更新 - [ ] 🔧 ci: CI/CD 配置修改 - [ ] ↩️ revert: 回退 - [ ] 🧹 chore: 其他,请具体描述 See merge request: cann/asc-devkit!12422 个月前
修复examples目录README.md里安装方式路径与实际路径不同的问题 Co-authored-by: hw-zjy<zhoujingyi9@hisilicon.com> # message auto-generated for no-merge-commit merge: !1165 merge 9.0.0 into 9.0.0 修复examples目录README.md里安装方式路径与实际路径不同的问题 Created-by: hw-zjy Commit-by: hw-zjy Merged-by: cann-robot Description: ## 描述 修复examples目录README.md里安装方式路径与实际路径不同的问题 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #xxx--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 fix: Bug 修复 - [ ] ✨ feat: 新功能 - [ ] ⚡ perf: 性能优化 - [ ] ♻️ refactor: 代码重构 - [ ] 🧪 test: 新增或修改测试 - [x] 📝 docs: 文档更新 - [ ] 🔧 ci: CI/CD 配置修改 - [ ] ↩️ revert: 回退 - [ ] 🧹 chore: 其他,请具体描述 See merge request: cann/asc-devkit!11652 个月前
fix simt example with cmakelist Co-authored-by: wulinyu<wulinyu4@huawei.com> # message auto-generated for no-merge-commit merge: !1821 merge 900 into 9.0.0 fix simt example with cmakelist Created-by: wulinyu Commit-by: wulinyu Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修改 SIMT编程样例,使用正式的Cmake编译方式,避免使用临时非正式编译。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #xxx--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] 🐛 fix: Bug 修复 - [ ] ✨ feat: 新功能 - [ ] ⚡ perf: 性能优化 - [ ] ♻️ refactor: 代码重构 - [ ] 🧪 test: 新增或修改测试 - [ ] 📝 docs: 文档更新 - [ ] 🔧 ci: CI/CD 配置修改 - [ ] ↩️ revert: 回退 - [ ] 🧹 chore: 其他,请具体描述 See merge request: cann/asc-devkit!18211 个月前
modify simt example path Co-authored-by: wulinyu<wulinyu4@huawei.com> # message auto-generated for no-merge-commit merge: !1162 merge 900 into 9.0.0 modify simt example path Created-by: wulinyu Commit-by: wulinyu Merged-by: cann-robot Description: ## 描述 example样例目录整改——simt样例 样例路径下新增03_simt_api目录,包含以下SIMT样例: ![image.png](https://raw.gitcode.com/user-images/assets/8547062/0cac8fa2-e52c-4e66-be1d-716e9cd06fec/image.png 'image.png') ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #xxx--> AR20260303626597 ## 测试 样例功能测试OK ## 文档更新 针对新目录层级架构,更新或新增readme文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 fix: Bug 修复 - [ ] ✨ feat: 新功能 - [ ] ⚡ perf: 性能优化 - [x] ♻️ refactor: 代码重构 - [ ] 🧪 test: 新增或修改测试 - [ ] 📝 docs: 文档更新 - [ ] 🔧 ci: CI/CD 配置修改 - [ ] ↩️ revert: 回退 - [ ] 🧹 chore: 其他,请具体描述 See merge request: cann/asc-devkit!11622 个月前
README.md

样例运行验证

开发者调用Ascend C API实现自定义算子后,可通过单算子调用的方式验证算子功能。本代码仓提供部分算子实现及其调用样例,具体如下。

算子开发样例

目录名称 功能描述
01_simd_cpp_api 基于Ascend C的SIMD API样例,通过<<<>>>直调的实现方式,介绍了SIMD API的使用方法
02_simd_c_api 基于Ascend C的C_API样例,通过C_API的实现方式,介绍了C_API的使用方法
03_simt_api 基于Ascend C SIMT编程的算子样例,通过<<<>>>直调的实现方式,介绍了SIMT的使用方法

npu-arch编译选项说明

开发者需根据实际的执行环境,修改具体样例目录下CMakeLists.txt文件中的--npu-arch编译选项,参考下表中的对应关系,修改为环境对应的npu-arch参数值。

产品型号 npu-arch参数
Ascend 950PR/Ascend 950DT --npu-arch=dav-3510
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
--npu-arch=dav-2201
Atlas 推理系列产品AI Core --npu-arch=dav-2002