文件最后提交记录最后更新时间
修复 Ascend950 初始化ut用例挂死问题 Co-authored-by: zhangyunqi<zhangyunqi5@huawei.com> # message auto-generated for no-merge-commit merge: !383 merge fix-ut-init-issues into master 修复 Ascend950 初始化ut用例挂死问题 Created-by: zhangyunqi Commit-by: zhangyunqi Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> Ascend950 主进程执行aclrt接口会导致后续子进程setdevice失效 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> https://gitcode.com/cann/shmem/issues/276 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ![image.png](https://raw.gitcode.com/user-images/assets/8546182/cff21311-f7c3-47a8-8ce8-873335e14b77/image.png 'image.png') 修复后 ![image.png](https://raw.gitcode.com/user-images/assets/8546182/7939e52c-7c4c-4501-990f-9fa2eac3434f/image.png 'image.png') ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!3831 天前
支持Ascend950 mte atomic Co-authored-by: vector5<caobingjie@huawei.com> Co-authored-by: zhangyunqi<zhangyunqi5@huawei.com> Co-authored-by: QK_25415<zhuzhiming1@huawei.com> # message auto-generated for no-merge-commit merge: !283 merge mteatomic into master 支持Ascend950 mte atomic Created-by: vector5 Commit-by: zhangyunqi;vector5;QK_25415 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 支持Ascend950 mte atomic的以下接口和UT T aclshmemx_mte_atomic_fetch(gm T *src, int32_t pe); void aclshmemx_mte_atomic_set(gm T *dst, T value, int32_t pe); T aclshmemx_mte_atomic_compare_swap(gm T *dst, T cond, T value, int32_t pe); T aclshmemx_mte_atomic_swap(gm T *dst, T value, int32_t pe); void aclshmemx_mte_atomic_inc(gm T *dst, int32_t pe); void aclshmemx_mte_atomic_add(gm T *dst, T value, int32_t pe); T aclshmemx_mte_atomic_fetch_inc(gm T *dst, int32_t pe); T aclshmemx_mte_atomic_fetch_add(gm T *dst, T value, int32_t pe); ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/shmem/issues/220 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A2验证ShmemAtomic ![image.png](https://raw.gitcode.com/user-images/assets/8546182/546614a6-b5e6-4124-97ea-b94023431719/image.png 'image.png') MteAtomic ![image.png](https://raw.gitcode.com/user-images/assets/8546182/c6eef612-3641-4bf6-a588-e3647ebbc7d0/image.png 'image.png') A5验证ShmemAtomic ![image.png](https://raw.gitcode.com/user-images/assets/8546182/0eb0a34a-4814-45b2-af42-7b467caeab4d/image.png 'image.png') MteAtomic ![image.png](https://raw.gitcode.com/user-images/assets/8546182/d8da0f93-294a-4fcd-a5ba-593aceaa7a06/image.png 'image.png') ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!2833 天前
新增Simt gm2gm接口的单元测试 Co-authored-by: mizuki_p<wanghan157@huawei.com> # message auto-generated for no-merge-commit merge: !308 merge gm2gm_utest into master 新增Simt gm2gm接口的单元测试 Created-by: mizuki_p Commit-by: mizuki_p Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 补充Simt、Simd混合编程场景下,Simt的gm2gm接口的单元测试 测试通过截图: ![image.png](https://raw.gitcode.com/user-images/assets/8546182/665ce9d6-50c1-49b4-9823-b7bb25481c11/image.png 'image.png') ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> [\[Task|任务\]: SHMEM支持SIMT方式的RMA接口 ](https://gitcode.com/cann/shmem/issues/198) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 此PR就是单元测试 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:补充单元测试 See merge request: cann/shmem!30817 天前
signal_add接口设置只使用1个核 Co-authored-by: vector5<caobingjie@huawei.com> # message auto-generated for no-merge-commit merge: !188 merge fix into master signal_add接口设置只使用1个核 Created-by: vector5 Commit-by: vector5 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> signal_add接口设置只使用用blockid为0的核 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ![image.png](https://raw.gitcode.com/user-images/assets/8546182/275729d7-0c1b-45d6-a9b5-8b75dd3ad074/image.png 'image.png') ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 See merge request: cann/shmem!1882 个月前
移除exit(1) Co-authored-by: caixilong<caixilong2@h-partners.com> # message auto-generated for no-merge-commit merge: !63 merge remove_exit into master 移除exit(1) Created-by: caixilong Commit-by: caixilong Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 单元测试中存在 ![image.png](https://raw.gitcode.com/user-images/assets/8546182/4760677d-d252-47d2-bddb-854f1651de76/image.png 'image.png') 不符合规范 现移除 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/shmem/issues/33 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 修改allocate_zero这一case的代码使其必fail 观测能否捕获 ![image.png](https://raw.gitcode.com/user-images/assets/8546182/0d048426-0cec-484f-8d07-b3243eb59a16/image.png 'image.png') ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!634 个月前
UDMA场景支持rootinfo自动生成 Co-authored-by: suqwe<sujianjia@huawei.com> # message auto-generated for no-merge-commit merge: !302 merge master into master UDMA场景支持rootinfo自动生成 Created-by: suqwe Commit-by: suqwe Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> UDMA场景支持rootinfo自动生成 ### 简介 昇腾芯片在950代际中, 超平面使用Unified Bus总线组网,在不同产品形态中使用多种不同的拓扑组网方式, 本模块用于在发现在不同拓扑下每条边的端点地址 #### 组网介绍 组网主要采用了MESH和CLOS两种类型组网。相关介绍可参考论文:https://arxiv.org/abs/2503.20377 ##### mesh组网 即每个NPU之间均有一条直连的物理链路,因此有一对独立的通信地址。 例如在同一个NPU板上有8个NPU,因此存在8*7/2 = 28条物理路径,即28对通信地址 ##### CLOS组网 任意两个NPU之间通过交换芯片转发。 因此一个NPU址需要一个地址。 在常见组网中,由于可靠性等原因,CLOS组网通常可以分为多个平面,每个平面对应一个地址。例如在液冷POD中,NPU使用两个独立的逻辑口连接两个分开的网络平面 ##### 组网规划 #### 网络层级说明 在950芯片代际中,按通信质量和范围,将网络划分为多层 | 网络层级| 说明 | |:-------| :-----------| |0 |通信质量最高,时延最低。多为MESH组网,主要是同一个NPU单板内的fullmesh网络和POD形态的框级网络| |1 |通信质量次高,时延中等。为CLOS组网, 通信范围较大,为超节点范围, 仍然在scale up范围内 | |2 |通信质量最低,CLOS组网, 通信范围为整个集群,主要是ROCE或者UBOE这类scale out网络| ##### 网络地址说明 | 网络层级| 说明 | |:-------| :-----------| |0 | 由于是mesh组网为主,因此有多对通信地址, 在topo addr info中表达为每个NPU上每个端口的地址, 地址类型为EID | |1 | 根据组网平面填写地址, 多平面组网时,地址数量于平面数量相同 , 集合通信在不同平面之间做流量分担 ,地址类型为EID| |2 |地址规划域层1相同, 地址类型为IP地址| ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/shmem/issues/175 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> UT用例 ![image.png](https://raw.gitcode.com/user-images/assets/8546182/95df7a81-91f5-4e60-b97c-dbe883118b21/image.png 'image.png') 测试 [root@localhost aclshmem-master]# ./build/bin/root_info_generate 3 Generating root info for NPU with physical ID: 3 Required buffer size: 2048 bytes topo_addr_info_get succeeded, actual size: 1329 bytes Rank info: {"version": "2.0","topo_file_path": "/usr/local/Ascend/driver/topo/950/atlas_850_1.json","rank_count": 1,"rank_list": [{"device_id": 3,"local_id": 3,"level_list": [{"net_layer": 0,"net_instance_id": "sp-1_srv65535","net_type": "MESH","net_attr": "","rank_addr_list": [{"addr_type": "EID","addr": "000000000000006000100000dfdf008b","plane_id": "plane_1","ports": ["1/0"]},{"addr_type": "EID","addr": "000000000000006000100000dfdf00cb","plane_id": "plane_1","ports": ["1/8"]},{"addr_type": "EID","addr": "000000000000006000100000dfdf00c3","plane_id": "plane_1","ports": ["1/7"]},{"addr_type": "EID","addr": "000000000000006000100000dfdf00ab","plane_id": "plane_1","ports": ["1/4"]},{"addr_type": "EID","addr": "000000000000006000100000dfdf00a3","plane_id": "plane_1","ports": ["1/3"]},{"addr_type": "EID","addr": "000000000000006000100000dfdf009b","plane_id": "plane_1","ports": ["1/2"]},{"addr_type": "EID","addr": "000000000000006000100000dfdf0093","plane_id": "plane_1","ports": ["1/1"]}]}, {"net_layer": 1,"net_instance_id": "superpod_-1","net_type": "CLOS","net_attr": "","rank_addr_list": [{"addr_type": "EID","addr": "000000000000004000100000dfdf00df","plane_id": "plane_1","ports": ["1/5","1/6"]},{"addr_type": "EID","addr": "000000000000006000100000dfdf005f","plane_id": "plane_0","ports": ["0/4","0/5","0/6","0/7"]}]}]}]} Topology file path: /usr/local/Ascend/driver/topo/950/atlas_850_1.json Root info generation completed successfully ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!30229 天前
新增Simt gm2gm接口的单元测试 Co-authored-by: mizuki_p<wanghan157@huawei.com> # message auto-generated for no-merge-commit merge: !308 merge gm2gm_utest into master 新增Simt gm2gm接口的单元测试 Created-by: mizuki_p Commit-by: mizuki_p Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 补充Simt、Simd混合编程场景下,Simt的gm2gm接口的单元测试 测试通过截图: ![image.png](https://raw.gitcode.com/user-images/assets/8546182/665ce9d6-50c1-49b4-9823-b7bb25481c11/image.png 'image.png') ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> [\[Task|任务\]: SHMEM支持SIMT方式的RMA接口 ](https://gitcode.com/cann/shmem/issues/198) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 此PR就是单元测试 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:补充单元测试 See merge request: cann/shmem!30817 天前
增加hbm内存泄漏检测脚本 Co-authored-by: vector5<caobingjie@huawei.com> # message auto-generated for no-merge-commit merge: !361 merge checkleak into master 增加hbm内存泄漏检测脚本 Created-by: vector5 Commit-by: vector5 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 增加hbm内存泄漏检测脚本 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> https://gitcode.com/cann/shmem/issues/264 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 950 ![image.png](https://raw.gitcode.com/user-images/assets/8546182/e6a0658b-a2b0-4ccc-9c35-18b5250adb38/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/8546182/953cf81d-dd78-4fdb-8d92-0ca3fd0061cf/image.png 'image.png') 910C ![image.png](https://raw.gitcode.com/user-images/assets/8546182/c353709a-092f-4d0a-85ab-9b854737cd76/image.png 'image.png') 910B ![image.png](https://raw.gitcode.com/user-images/assets/8546182/c1ac229c-993a-4e0c-b4cf-20a7dfdee3b1/image.png 'image.png') ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!3611 天前