| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
适配msprof 生成的 profiling CSV 数据中的 kernel_type 列值改变 Co-authored-by: vector5<caobingjie@huawei.com> # message auto-generated for no-merge-commit merge: !390 merge fixallgather into master 适配msprof 生成的 profiling CSV 数据中的 kernel_type 列值改变 Created-by: vector5 Commit-by: vector5 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> msprof 生成的 profiling CSV 数据中的 kernel_type 列值由AICORE->MIX_AIV ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> https://gitcode.com/cann/shmem/issues/177 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->  ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!390 | 20 天前 | |
fix LICENSE Co-authored-by: jiang-xinyu3<jiangxinyu3@hisilicon.com> | 6 个月前 | |
examples不支持Ascend950算子添加文档说明 Co-authored-by: zhangyunqi<zhangyunqi5@huawei.com> # message auto-generated for no-merge-commit merge: !478 merge fix/addmdA5 into master examples不支持Ascend950算子添加文档说明 Created-by: zhangyunqi Commit-by: zhangyunqi Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> examples不支持Ascend950算子添加文档说明 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> https://gitcode.com/cann/shmem/issues/178 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!478 | 20 小时前 | |
add aclGraph demo Co-authored-by: VallenChen<chenwei542@huawei.com> # message auto-generated for no-merge-commit merge: !282 merge br_personal/vallenChen/aclGraph_demo into master add aclGraph demo Created-by: vallenChen Commit-by: VallenChen Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 添加使用aclgraph_demo和rdma_aclgraph_demo ### aclgraph_demo 首先为了适配aclGraph,将allgather算子的magic入参从int值换成Device侧的地址(__gm__ int * )这样支持在aclGraph图(model)循环调用中修改。 aclGraph图结构如下:  将第一个add的输出作为第一个allgather的输入,之后将两个allgather的输出作为第二个add的输入。将其作为aclGraph的图(model),第一次循环进行图的捕获,后续循环重放捕获完成的图。通过每次循环第二个add的输出是否符合预期,来判断allgather在图中功能是否正常。 ### rdma_aclgraph_demo 由于rdma allgather只发送Write,因此在入图时需要在rdma allgather前后添加 aclshmemx_handle_wait接口进行同步,确保所有PE上的图均已执行到相应阶段,确保aclGraph图(model)的精度正常。 aclGraph图结构如下:  ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 在CANN 9.0.0和CANN 8.5.0上循环执行两个demo,功能正常。 ### aclgraph_demo: * 单机4卡场景循环2000次,功能正常:  * aclgraph_demo profiling:  ### rdma_aclgraph_demo: * 2机8卡场景循环2000次,功能正常。  * rdma_aclgraph_demo profiling:  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述: See merge request: cann/shmem!282 | 28 天前 | |
fix LICENSE Co-authored-by: jiang-xinyu3<jiangxinyu3@hisilicon.com> | 6 个月前 | |
fix spell problem Co-authored-by: Z_ZW2025<zhuozhenwei1@h-partners.com> # message auto-generated for no-merge-commit merge: !289 merge master into master fix spell problem Created-by: Z_ZW2025 Commit-by: Z_ZW2025 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 注释拼写错误修改 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/shmem/issues/210 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!289 | 1 个月前 | |
fix report init Co-authored-by: huangxiaolan<huangxiaolan7@huawei.com> # message auto-generated for no-merge-commit merge: !300 merge fix_report_master into master 修复 mssanitizer 工具报告信息未做 零初始化 问题 并同步修改allgather example中移除 mssanitizer 选项 Created-by: huangxiaolan Commit-by: huangxiaolan Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修复 mssanitizer 工具报告信息未做 零初始化 问题 修改allgather example中移除 mssanitizer 选项,因为该 example 中的 各进程单独调用 mssanitizer 工具,会使得工具不能结合分析 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue #123 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:适配工具信息上报 See merge request: cann/shmem!300 | 1 个月前 |
使用方式:
- 在shmem/目录编译:
- Ascend910B/C 平台:
bash scripts/build.sh -examples
- Ascend950 平台:
bash scripts/build.sh -soc_type Ascend950 -examples
- 在shmem/examples/allgather目录执行demo:
# 完成PEs卡下的allgather同时验证精度,性能数据会输出在result.csv中。
# PEs : [2, 4, 8]
# TYPEs : [int, int32_t, float16_t, bfloat16_t]
bash run.sh -pes ${PEs} -type ${TYPEs}