文件最后提交记录最后更新时间
use runtime aicBlocks for soft MIX participant indexing Co-authored-by: echo_stone<liulei281@huawei.com> # message auto-generated for no-merge-commit merge: !1066 merge syncall into master use runtime aicBlocks for soft MIX participant indexing Created-by: echo_stone Commit-by: echo_stone Merged-by: cann-robot Description: ## 描述 syncall 测试用例中的soft模式也固定了核数。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!106621 小时前
use runtime aicBlocks for soft MIX participant indexing Co-authored-by: echo_stone<liulei281@huawei.com> # message auto-generated for no-merge-commit merge: !1066 merge syncall into master use runtime aicBlocks for soft MIX participant indexing Created-by: echo_stone Commit-by: echo_stone Merged-by: cann-robot Description: ## 描述 syncall 测试用例中的soft模式也固定了核数。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!106621 小时前
optimize CCU TReduce/Tbroadcast/TGather/TScatter implementation Co-authored-by: kerwinair<wenquan.xu@huawei.com> # message auto-generated for no-merge-commit merge: !1054 merge pto-ccu-aiv-trigger into master optimize CCU TReduce/Tbroadcast/TGather/TScatter implementation Created-by: kerwinair Commit-by: kerwinair Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!10542 天前
add TPREFETCH and PTO_PREFETCH feature in A5 Co-authored-by: ChanKaLok<chan.ka.lok@huawei.com> # message auto-generated for no-merge-commit merge: !116 merge pto_prefetch_a5_1 into master add TPREFETCH and PTO_PREFETCH feature in A5 Created-by: ChanKaLok Commit-by: ChanKaLok Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> add TPREFETCH and PTO_PREFETCH feature in A5 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> [#49](https://gitcode.com/cann/pto-isa/issues/49) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> FA kernel enable either smda or aiv ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!1164 个月前
[feat.]Refactor Kirin9030 TRem/TRemS: add Inf/NaN handling, implement int remainder in PTO ISA, and overhaul test infrastructure Co-authored-by: HuangXingYuan_777<huangxingyuan4@huawei.com> # message auto-generated for no-merge-commit merge: !1063 merge vmod into master [feat.]Refactor Kirin9030 TRem/TRemS: add Inf/NaN handling, implement int remainder in PTO ISA, and overhaul test infrastructure Created-by: HuangXingYuan_777 Commit-by: HuangXingYuan_777 Merged-by: cann-robot Description: ## 描述 Refactor Kirin9030 TRem/TRemS: add Inf/NaN handling, implement int remainder in PTO ISA, and overhaul test infrastructure ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!10631 天前
KIRINX90支持TQUANT Co-authored-by: qq_53648788<lishaoran1@h-partners.com> # message auto-generated for no-merge-commit merge: !1061 merge master into master KIRINX90支持TQUANT Created-by: qq_53648788 Commit-by: qq_53648788 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!10611 天前
origin code Signed-off-by: yujiangtao <yujiangtao11@h-partners.com> 5 个月前
Add README in Chinese Co-authored-by: RuoyuZhou<ruoyu.zhou@hisilicon.com> # message auto-generated for no-merge-commit merge: !22 merge open_source into master Add README in Chinese Created-by: zhoubotcam Commit-by: RuoyuZhou Merged-by: cann-robot Description: ## 描述 Add Chinese README for Chinese readers ## 关联的Issue https://gitcode.com/cann/pto-isa/issues/7 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!224 个月前
implementation of TPrefetch using Async SDMA on A2A3 Co-authored-by: kerwinair<wenquan.xu@huawei.com> # message auto-generated for no-merge-commit merge: !933 merge prefetch into master implementation of TPrefetch using Async SDMA on A2A3 Created-by: kerwinair Commit-by: kerwinair Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/pto-isa!93319 天前
README.md

include/pto/npu/

NPU-side PTO instruction implementations. Different SoC generations have different optimized implementations and pipeline details.

Layout

  • a2a3/: Ascend A2/A3 implementations (e.g., TAdd.hpp, TMatmul.hpp, TLoad.hpp)
  • a5/: Ascend A5 implementations (e.g., TAdd.hpp, TMatmul.hpp, TLoad.hpp)

Selecting the SoC Version

SoC selection is controlled by the build system and test scripts:

  • tests/script/run_st.py / tests/script/build_st.py: select via -v a3|a5
  • tests/npu/<soc>/src/st/CMakeLists.txt: builds the corresponding ST targets and dependencies per SoC

For an end-to-end walkthrough, start with docs/getting-started.md.