文件最后提交记录最后更新时间
增加notify_wait机制及使用样例 Co-authored-by: qq_44359711<caobingjie@huawei.com> # message auto-generated for no-merge-commit merge: !146 merge notifywait into master 增加notify_wait机制及使用样例 Created-by: vector5 Commit-by: vector5;qq_44359711 Merged-by: cann-robot Description: ## 描述 增加notify_wait机制及使用样例 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ![image.png](https://raw.gitcode.com/user-images/assets/8546182/a8de97dc-207b-4560-a648-a4cb8ef77f6f/image.png 'image.png') ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!1462 个月前
update SDMA使用说明 Co-authored-by: Z_ZW2025<zhuozhenwei1@h-partners.com> # message auto-generated for no-merge-commit merge: !364 merge master into master update SDMA使用说明 Created-by: Z_ZW2025 Commit-by: Z_ZW2025 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!3648 天前
编译选项整改 xcce2xasc Co-authored-by: zhangyunqi<zhangyunqi5@huawei.com> # message auto-generated for no-merge-commit merge: !128 merge xcce2xasc into master 编译选项整改 xcce2xasc Created-by: zhangyunqi Commit-by: zhangyunqi Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> xcce2xasc ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/shmem/issues/95 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ![image.png](https://raw.gitcode.com/user-images/assets/8546182/9e5c647c-f4ef-43e2-90bb-14f900cd48fa/image.png 'image.png') A5 ![image.png](https://raw.gitcode.com/user-images/assets/8546182/86160a4e-89c8-4b48-8fe0-992809bfba91/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/8546182/0ca6578d-9de2-4661-9099-641c2223a74b/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/8546182/5201bfb2-5503-451e-8028-f4abb1c6d21e/image.png 'image.png') rdma ![image.png](https://raw.gitcode.com/user-images/assets/8546182/5a1313b7-ea0b-45cf-b8a3-bda6c332ad3f/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/8546182/90473372-2bb5-421a-bed4-4c168901d845/image.png 'image.png') ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!1281 个月前
整改部分样例的文档和脚本环境变量 Co-authored-by: hbhdhd<luxianbin1@huawei.com> # message auto-generated for no-merge-commit merge: !269 merge docs into master 整改部分样例的文档和脚本环境变量 Created-by: hbhdhd Commit-by: hbhdhd Merged-by: cann-robot Description: ## 描述 修改环境变量名称不一致问题。 **问题**:代码读取的环境变量是 SHMEM_UID_SESSION_ID,部分文档和脚本中使用的是 ACLSHMEM_UID_SESSION_ID。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue [#209](https://gitcode.com/cann/shmem/issues/209) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 更新了相关示例的脚本和 README 文件。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!2691 个月前
README.md

NotifyWait机制使用说明

环境要求和准备

SDMA功能在9.0.0及以上版本(尝鲜版)新增支持。需要下载并安装以下cann和ops软件包:

example执行说明

1.在shmem/目录编译软件包并安装:

bash scripts/build.sh -package
./install/*/SHMEM_1.0.0_linux-*.run --install

2.在shmem/目录下编译examples:

bash scripts/build.sh -examples

3.在shmem/examples/notifywait目录执行demo:

bash run.sh -pes ${PES} -type ${TYPES}
  • 参数说明
    • PES:指定用于运行的设备(NPU)数量,限定单台机器内。
    • TYPES:指定传输数据类型,当前支持:int,uint8,int64,fp32。

NotifyWait用法说明

用法示例

notifywait

// 步骤1:
stream1上的kernel1:调用sdma接口搬运数据+aclshmemx_sdma_notify_record
// 步骤2:
host:aclrtWaitAndResetNotify(notify_id, stream2, 0)
// 步骤3:
stream2上的kernel2:使用sdma搬运好的数据

用法说明

aclshmemx_sdma_notify_record中会下发record类型的sqe到stars,后续在host侧等待notify记录完成,再继续执行后续kernel。相比aclshmemx_sdma_quiet使用AIV轮询flag的方式,可及时释放AIV资源。