文件最后提交记录最后更新时间
Replace blockDim with numBlocks Co-authored-by: 王旭<wangxu243@huawei.com> # message auto-generated for no-merge-commit merge: !237 merge master into master Replace blockDim with numBlocks Created-by: wx369 Commit-by: 王旭 Merged-by: cann-robot Description: ## 描述 修正blockDim命名,改为numBlocks ## 关联的Issue 不涉及 ## 测试 通过了样例的编译运行 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!2373 个月前
updated the readme link Co-authored-by: gcw_atM8lhjZ<chenhangxin@huawei.com> # message auto-generated for no-merge-commit merge: !301 merge master into master updated the readme link Created-by: gcw_atM8lhjZ Commit-by: gcw_atM8lhjZ Merged-by: cann-robot Description: ## 描述 优化example中README的描述,更新链接 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 不涉及 ## 文档更新 examples/00_introduction/00_helloworld/hello_world_aicpu/README.md examples/00_introduction/00_helloworld/hello_world_npu/README.md examples/00_introduction/03_matmulleakyrelu/matmul_leakyrelu/README.md examples/00_introduction/04_simple_operator/add_dynamic/README.md examples/00_introduction/04_simple_operator/broadcast/README.md examples/00_introduction/04_simple_operator/sub/README.md examples/02_features/00_framework_launch/README.md examples/02_features/04_micro_api/move_mask_reg/README.md examples/02_features/04_micro_api/move_successive_align/README.md examples/02_features/04_micro_api/move_successive_unalign/README.md examples/02_features/04_micro_api/move_unsuccessive_align/README.md examples/02_features/04_micro_api/read_write_sync/README.md examples/02_features/04_micro_api/vector_add/README.md examples/02_features/04_micro_api/write_write_sync/README.md examples/02_features/07_data_movement/data_copy_ub2l1/README.md examples/02_features/07_data_movement/data_copy_ub2l1_kfc/README.md examples/02_features/08_tiling/README.md examples/02_features/09_unalign/abs_duplicate/README.md examples/02_features/09_unalign/abs_gather_mask/README.md examples/02_features/09_unalign/reduce_min/README.md examples/02_features/09_unalign/whole_reduce_sum/README.md examples/03_libraries/02_activation/README.md examples/03_libraries/05_reduce/reduce_custom/README.md examples/04_best_practices/01_bank_conflict/01_bank_conflict_950/README.md examples/04_best_practices/01_bank_conflict/bank_conflict/README.md examples/04_best_practices/10_compatibility_cases/data_copy_l1togm_910B/README.md examples/04_best_practices/10_compatibility_cases/data_copy_l1togm_950/README.md examples/04_best_practices/10_compatibility_cases/init_const_value_910B/README.md examples/04_best_practices/10_compatibility_cases/init_const_value_950/README.md examples/04_best_practices/10_compatibility_cases/matmul_s4_910B/README.md examples/04_best_practices/10_compatibility_cases/matmul_s4_950/README.md examples/04_best_practices/10_compatibility_cases/set_loaddata_boundary_910B/README.md examples/04_best_practices/10_compatibility_cases/set_loaddata_boundary_950/README.md examples/04_best_practices/12_high_performance_vf/optimize_vf_continious_align/README.md examples/04_best_practices/12_high_performance_vf/optimize_vf_dual_instr/README.md examples/04_best_practices/12_high_performance_vf/optimize_vf_fusion/README.md examples/04_best_practices/12_high_performance_vf/optimize_vf_loop/README.md examples/04_best_practices/13_optimize_datacopy/optimize_datacopy_loop_mode/README.md examples/04_best_practices/13_optimize_datacopy/optimize_datacopy_nddma/README.md examples/04_best_practices/13_optimize_datacopy/optimize_reduce_invalid_datacopy/README.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!3013 个月前
Replace blockDim with numBlocks Co-authored-by: 王旭<wangxu243@huawei.com> # message auto-generated for no-merge-commit merge: !237 merge master into master Replace blockDim with numBlocks Created-by: wx369 Commit-by: 王旭 Merged-by: cann-robot Description: ## 描述 修正blockDim命名,改为numBlocks ## 关联的Issue 不涉及 ## 测试 通过了样例的编译运行 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!2373 个月前
Replace blockDim with numBlocks Co-authored-by: 王旭<wangxu243@huawei.com> # message auto-generated for no-merge-commit merge: !237 merge master into master Replace blockDim with numBlocks Created-by: wx369 Commit-by: 王旭 Merged-by: cann-robot Description: ## 描述 修正blockDim命名,改为numBlocks ## 关联的Issue 不涉及 ## 测试 通过了样例的编译运行 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!2373 个月前
libraries && best_practices sample Co-authored-by: yxf-dev-ops<yexiaofeng4@huawei.com> Co-authored-by: gcw_atM8lhjZ<chenhangxin@huawei.com> # message auto-generated for no-merge-commit merge: !179 merge master into master libraries && best_practices sample Created-by: yxf-dev-ops Commit-by: gcw_atM8lhjZ;yxf-dev-ops Merged-by: cann-robot Description: ## 描述 新增部分 libraries && best_practices 样例 更新样例如下: matmul: 00_math 01_matrix 02_activation 03_normalization 04_quantization 05_reduce 06_sort best_practices: 00_add_doublebuffer 02_aicpu_device_tiling 05_mata_address_conflict 10_compatibility_cases 12_high_performance_vf 14_pure_simt_gather 01_bank_conflict 03_l2_cache_bypass 06_grouped_matmul 11_pattern_transformation 13_optimize_datacopy ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!1794 个月前
Replace blockDim with numBlocks Co-authored-by: 王旭<wangxu243@huawei.com> # message auto-generated for no-merge-commit merge: !237 merge master into master Replace blockDim with numBlocks Created-by: wx369 Commit-by: 王旭 Merged-by: cann-robot Description: ## 描述 修正blockDim命名,改为numBlocks ## 关联的Issue 不涉及 ## 测试 通过了样例的编译运行 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!2373 个月前
修改最佳实践目录和特性目录下的README文件 Co-authored-by: zhuangjinjun<zhuangjinjun@huawei.com> # message auto-generated for no-merge-commit merge: !318 merge fix-readme into master 修改最佳实践目录和特性目录下的README文件 Created-by: printfscanfmain Commit-by: zhuangjinjun Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修改最佳实践目录和特性目录下的README文件 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 不涉及 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> examples/02_features/07_data_movement/README.md examples/02_features/README.md examples/04_best_practices/10_compatibility_cases/README.md examples/04_best_practices/12_high_performance_vf/README.md examples/04_best_practices/13_optimize_datacopy/README.md examples/04_best_practices/README.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!3183 个月前
Replace blockDim with numBlocks Co-authored-by: 王旭<wangxu243@huawei.com> # message auto-generated for no-merge-commit merge: !237 merge master into master Replace blockDim with numBlocks Created-by: wx369 Commit-by: 王旭 Merged-by: cann-robot Description: ## 描述 修正blockDim命名,改为numBlocks ## 关联的Issue 不涉及 ## 测试 通过了样例的编译运行 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!2373 个月前
修改最佳实践目录和特性目录下的README文件 Co-authored-by: zhuangjinjun<zhuangjinjun@huawei.com> # message auto-generated for no-merge-commit merge: !318 merge fix-readme into master 修改最佳实践目录和特性目录下的README文件 Created-by: printfscanfmain Commit-by: zhuangjinjun Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修改最佳实践目录和特性目录下的README文件 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 不涉及 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> examples/02_features/07_data_movement/README.md examples/02_features/README.md examples/04_best_practices/10_compatibility_cases/README.md examples/04_best_practices/12_high_performance_vf/README.md examples/04_best_practices/13_optimize_datacopy/README.md examples/04_best_practices/README.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!3183 个月前
修改最佳实践目录和特性目录下的README文件 Co-authored-by: zhuangjinjun<zhuangjinjun@huawei.com> # message auto-generated for no-merge-commit merge: !318 merge fix-readme into master 修改最佳实践目录和特性目录下的README文件 Created-by: printfscanfmain Commit-by: zhuangjinjun Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修改最佳实践目录和特性目录下的README文件 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 不涉及 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> examples/02_features/07_data_movement/README.md examples/02_features/README.md examples/04_best_practices/10_compatibility_cases/README.md examples/04_best_practices/12_high_performance_vf/README.md examples/04_best_practices/13_optimize_datacopy/README.md examples/04_best_practices/README.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!3183 个月前
修改最佳实践目录和特性目录下的README文件 Co-authored-by: zhuangjinjun<zhuangjinjun@huawei.com> # message auto-generated for no-merge-commit merge: !318 merge fix-readme into master 修改最佳实践目录和特性目录下的README文件 Created-by: printfscanfmain Commit-by: zhuangjinjun Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修改最佳实践目录和特性目录下的README文件 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 不涉及 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> examples/02_features/07_data_movement/README.md examples/02_features/README.md examples/04_best_practices/10_compatibility_cases/README.md examples/04_best_practices/12_high_performance_vf/README.md examples/04_best_practices/13_optimize_datacopy/README.md examples/04_best_practices/README.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/asc-devkit!3183 个月前
README.md

BestPractices样例介绍

概述

基于Ascend C的性能优化实践,聚焦于关键算子与内存访问的调优,旨在提升在Ascend平台上的运行效率。

算子开发样例

目录名称 功能描述
00_add_doublebuffer 本样例介绍基于静态Tensor方式编程的场景下Add算子的实现方法,优化性能,使用double buffer进行流水排布,支持main函数和kernel函数在同一个cpp文件中实现,并提供<<<>>>直调方法。
01_bank_conflict 基于AscendC的bank冲突性能优化样例。
02_aicpu_device_tiling 本样例介绍使用AI CPU算子进行tiling下沉计算的实现, 在device侧将AI CPU算子的计算结果传给AI Core算子,使用<<<>>>内核调用符来完成算子核函数在NPU侧运行验证的基础流程。
03_l2_cache_bypass 本样例介绍了设置L2 CacheMode的方法以及其影响场景,并提供核函数直调方法。
05_mata_address_conflict 本样例介绍了同地址冲突的影响以及两种解决方法,并提供核函数直调方法。
06_grouped_matmul 本样例介绍QuantGroupMatmul算子在NPU上高性能实现,支持分组量化矩阵乘与Gelu激活计算。
10_compatibility_cases 本样例介绍Atlas A2 训练系列产品/Atlas A2 推理系列产品部分不兼容特性迁移至950的实现样例方法,不兼容场景包括从L1 Buffer直接搬运到GM、L0A Buffer/L0B Buffer、int4b_t数据类型下的矩阵计算、L1 Buffer带边界值场景。
11_pattern_transformation 新架构下基础的mmad样例,从L1 Buffer->L0A的通路不需要做Nz2Zz分型转换。
12_high_performance_vf 基于VF函数的性能优化样例,通过<<<>>>直调的实现方式,介绍了VF循环优化、VF指令双发优化、VF连续非对齐场景优化、VF融合优化的方法。
13_optimize_datacopy 基于搬运类API使用的优化样例,通过<<<>>>直调的实现方式,介绍了减少无效数据搬运、减少搬运指令数量等方法。
14_pure_simt_gather 纯SIMT编程方式实现的算子样例,支持动态计算切分参数。