| [bugfix!!!]7 bugfix&eod update
Co-authored-by: EX_mitsu<yangjie409@h-partners.com>
# message auto-generated for no-merge-commit merge:
!3070 merge master into master
[bugfix!!!]7 bugfix&eod update
Created-by: EX_mitsuX
Commit-by: EX_mitsu
Merged-by: ascend-robot
Description: 1.修复premute融合算子开启时新增同步使能错误的问题。
2.修复overlap特性中prob中间变量内存未正确释放的问题。
3.优化EoD加速模式下的性能,去除多余的cpu操作,EoD加速模式性能提升约2%+。
4.修复EoD模式中,TND(THD)下位置编码计算错误的问题。
5.同步readme描述,补充EoD加速模式下对--variable-seq-lengths的拦截,否则该场景会出现FA算子前向报错,并对EoD的校验重新整理。
6.优化部分变量及函数的命名,使其更贴近具体职能,并减少多余的get_args使用。
7.修复alltoall overlap下同时开启ETP与共享专家时报错的问题。
8.修复fbov开启共享专家产生的多流同步问题。
9.修复alltoall_ov与fb_ov中开启zero_memory时,重计算部分permute融合算子未生效的问题。
See merge request: Ascend/MindSpeed!3070 | 5 个月前 |