SHMEM SIG

shmem SIG 致力于面向昇腾AI集群的分布式共享内存编程库的设计、开发与维护。该库遵循 OpenSHMEM 标准,并与主流实现技术对齐,为多机多卡场景提供统一的全局地址空间抽象与高性能通信能力。我们提供远程内存访问、通信域管理、内存分配及传输同步等核心功能,通过高效易用的访存接口,支持跨节点全局内存共享,并赋能通算融合等新型算子的开发。该库旨在提升AI集群的通信性能与编程效率,为上层应用构建大容量内存池提供稳定可靠的基础设施支持。shmem SIG 负责该库的技术规划、版本演进与相应的社区支持工作。

工作目标

  1. 负责分布式共享内存编程库的整体架构设计、功能模块规划、接口规范定义、平台适配策略以及编程模型演进等相关技术路线的制定与管理。
  2. 针对库实现与演进过程中的关键技术难题(如通信性能优化、一致性模型、资源管理等),组织研讨并形成解决方案,推动技术架构的持续迭代与长期发展战略的落地。
  3. 负责处理开源仓库中的代码缺陷(Bug)、响应用户提交的Issue与功能诉求,维护代码质量,保障库的稳定性与可用性,并协同社区推动问题的解决与改进。

成员

Maintainer 列表

Committer 列表

社区运作

  • 双周例会,每双周周三 16:00-17:30(北京时间);首次例会在2026-01-14举办,具体时间与调整可关注下方纪要与邮件列表
  • 会议地址
  • 议题申报
  • 会议纪要

SIG订阅

仓库清单

仓库地址: