| [feature] 扩展 CallStack 类支持多 kernel 调用栈查询 Co-authored-by: cycoe<zhuhaonan6@h-partners.com> # message auto-generated for no-merge-commit merge: !122 merge cross_npu_callstack into master [feature] 扩展 CallStack 类支持多 kernel 调用栈查询 Created-by: cycoe Commit-by: cycoe Merged-by: ascend-robot Description: ### 1. 修改描述 - **修改原因:** mssanitizer 需要支持 shmem 算子卡间共享内存竞争检测 - **修改方案:** 运行时收集所有卡上的执行指令记录,并进行检测 - **修改内容:** 1. 扩展 CallStack 类,支持同时管理多个 kernel 的调用栈缓存和查询 2. memcheck、synccheck 等不涉及卡间检测的,kernelName 直接从 RuntimeContext 上下文中获取,与之前保持一致;racecheck 涉及卡间检测,kernelName 信息从 KernelManager 中获取 - [ ] **涉及代码双合**(贴上另一个PR链接): ---- ### 2. 功能验证 - [ ] **功能自验截图**(请确保不体现个人信息) 不涉及 - [x] **冒烟是否通过** 失败用例与本 PR 无关 [----------] reduce 158 case(s) from 14 test suite(s) [ FAILED ] 5 case(s) from 1 suite(s) failed [ FAILED ] intrinsics_record_test.sink_avg_pool2d_static_test [ FAILED ] intrinsics_record_test.sink_avg_pool2d_mix_test [ FAILED ] intrinsics_record_test.sink_avg_pool2d_static_with_kernel_name_test [ FAILED ] intrinsics_record_test.sink_avg_pool2d_mix_with_kernel_name_test [ FAILED ] intrinsics_record_test.static_stub_vec_calc_intrinsics [----------] reduce done ---- ### 3. 代码检视 - **要求:** - 合入功能代码大于 200 行,需要sig会议申报代码检视议题,并在PR中标注会议。 - committer评估是否需要在sig会议进行代码检视。 - 参与检视的committer人员名单与检视时间。 - 大于 1000 行代码原则上不允许合入,需进行备案。 - [x] **是否经过代码检视** - [x] **是否具备UT测试用例看护** - [ ] **是否需要在sig会议中进行代码检视** - **检视committer人员名单与检视时间:** ---- ### 4. 资料修改自检 - **资料修改:** 不涉及 ---- See merge request: Ascend/mssanitizer!122 | 2 个月前 |