op-plugin/op_plugin/utils · Ascend/op-plugin - AtomGit

ascend-robot[26.0]fix stream in workspace for EXEC_EXT

文件	最后提交记录	最后更新时间
custom_functions	fix:修复aclgraph场景下fa算子在replay阶段无法控核 Co-authored-by: ChengLyric<licheng236@huawei.com> # message auto-generated for no-merge-commit merge: !4617 merge 26.0.0_fix_fia_core into 26.0.0 fix:修复aclgraph场景下fa算子在replay阶段无法控核 Created-by: Guanam2020 Commit-by: ChengLyric Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现，涉及哪些组件之间进行交互，可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR，需要补充详细设计文档（说明上下游组件关系、时序图、类图、DFX能力等内容）在fa算子计算max workspace时调用use接口设置线程变量 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景，测试方法。如果本次测试方式与常规单元测试不同，请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护，并补充测试自验证截图 A2、A5问题场景已验证ok # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4617	1 个月前
AdvancedIndex.cpp	!2596 [DFX] More detail info in op_log and support common OP_LOG. Merge pull request !2596 from 刘嘉巍/master-dev	11 个月前
AdvancedIndex.h	!2284 Clean code Merge pull request !2284 from wgb/clean_code	1 年前
Export.h	!1242 Update copyright * Update copyright	2 年前
KernelNpuNewParams.cpp	!2595 [Feature] Support npu_add_rms_norm_quant. Merge pull request !2595 from 刘嘉巍/log	11 个月前
KernelNpuNewParams.h	!2595 [Feature] Support npu_add_rms_norm_quant. Merge pull request !2595 from 刘嘉巍/log	11 个月前
KernelNpuOutputDtype.cpp	feat: 新增DC算子Setup/Teardown新接口 Co-authored-by: tongzy1242<tongzeyun@huawei.com> # message auto-generated for no-merge-commit merge: !4468 merge new_op_urma into master feat: 新增DC算子Setup/Teardown新接口 Created-by: tongzy1242 Commit-by: tongzy1242 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> Issue [#892](https://gitcode.com/cann/ops-transformer/issues/892) - [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现，涉及哪些组件之间进行交互，可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR，需要补充详细设计文档（说明上下游组件关系、时序图、类图、DFX能力等内容）具体实现包括：1）在YAML配置文件中注册算子并配置ACL接口；2）在Python端添加元函数，用于编译时的形状和数据类型推断；3）在C++端实现输出形状和数据类型（如FLOAT8_E8M0）的动态计算逻辑；4）在算子注册配置（JSON）中补充接口签名；5）新增了FakeTensor模式下的元数据测试和多进程分布式环境下的功能集成测试，以验证算子链路的正确性。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” 本次修改在算子插件框架中新增了四个算子定义：npu_moe_distribute_dispatch_setup、npu_moe_distribute_dispatch_teardown、npu_moe_distribute_combine_setup和npu_moe_distribute_combine_teardown。 # 【功能验证】 > 说明测试场景，测试方法。如果本次测试方式与常规单元测试不同，请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护，并补充测试自验证截图已本地自验证 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4468	2 个月前
KernelNpuOutputDtype.h	feat: 新增DC算子Setup/Teardown新接口 Co-authored-by: tongzy1242<tongzeyun@huawei.com> # message auto-generated for no-merge-commit merge: !4468 merge new_op_urma into master feat: 新增DC算子Setup/Teardown新接口 Created-by: tongzy1242 Commit-by: tongzy1242 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> Issue [#892](https://gitcode.com/cann/ops-transformer/issues/892) - [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现，涉及哪些组件之间进行交互，可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR，需要补充详细设计文档（说明上下游组件关系、时序图、类图、DFX能力等内容）具体实现包括：1）在YAML配置文件中注册算子并配置ACL接口；2）在Python端添加元函数，用于编译时的形状和数据类型推断；3）在C++端实现输出形状和数据类型（如FLOAT8_E8M0）的动态计算逻辑；4）在算子注册配置（JSON）中补充接口签名；5）新增了FakeTensor模式下的元数据测试和多进程分布式环境下的功能集成测试，以验证算子链路的正确性。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” 本次修改在算子插件框架中新增了四个算子定义：npu_moe_distribute_dispatch_setup、npu_moe_distribute_dispatch_teardown、npu_moe_distribute_combine_setup和npu_moe_distribute_combine_teardown。 # 【功能验证】 > 说明测试场景，测试方法。如果本次测试方式与常规单元测试不同，请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护，并补充测试自验证截图已本地自验证 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4468	2 个月前
KernelNpuOutputSize.cpp	[fix] isclose rtol和atol添加check Co-authored-by: maoyuanpeng1<maoyuanpeng@huawei.com> # message auto-generated for no-merge-commit merge: !4492 merge br_fix_isclose_infer_size into master [fix] isclose rtol和atol添加check Created-by: maoyuanpeng1 Commit-by: maoyuanpeng1 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > https://gitcode.com/Ascend/pytorch/issues/1570 - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 torch.isclose算子未对 rtol和atol进行校验，rtol和atol为负数时应该报错。复现脚本： ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) # 应该报错，但没有 tensor([[True, True], [True, True]], device='npu:0') ``` 方案： isclose算子使用 gen_opapi自动生成下发逻辑。故可以在`infer size`的时候添加校验逻辑。 1.在op_plugin_functions.yaml 修改isclose算子gen_opapi size字段的内容。 ```yaml - func: isclose(Tensor self, Tensor other, float rtol=1e-05, float atol=1e-08, bool equal_nan=False) -> Tensor acl_op: all_version op_api: all_version gen_opapi: out: size: 'isclose_output_size(self, other, rtol, atol, equal_nan)' # 修改点 dtype: at::kBool exec: aclnnIsClose ``` 2.在op-plugin/op_plugin/utils/KernelNpuOutputSize.h和op-plugin/op_plugin/utils/KernelNpuOutputSize.cpp中添加isclose_output_size函数的声明和实现，infer size复用之前写的逻辑并添加check。验证效果： ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: atol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, -0.1, 0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, 0.1) tensor([[True, True], [True, True]], device='npu:0') ``` # 【资料变更】不涉及 # 【接口变更】不涉及 # 【功能验证】添加报错信息 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [ ] 代码注释完备，正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4492	2 个月前
KernelNpuOutputSize.h	[fix] isclose rtol和atol添加check Co-authored-by: maoyuanpeng1<maoyuanpeng@huawei.com> # message auto-generated for no-merge-commit merge: !4492 merge br_fix_isclose_infer_size into master [fix] isclose rtol和atol添加check Created-by: maoyuanpeng1 Commit-by: maoyuanpeng1 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > https://gitcode.com/Ascend/pytorch/issues/1570 - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 torch.isclose算子未对 rtol和atol进行校验，rtol和atol为负数时应该报错。复现脚本： ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) # 应该报错，但没有 tensor([[True, True], [True, True]], device='npu:0') ``` 方案： isclose算子使用 gen_opapi自动生成下发逻辑。故可以在`infer size`的时候添加校验逻辑。 1.在op_plugin_functions.yaml 修改isclose算子gen_opapi size字段的内容。 ```yaml - func: isclose(Tensor self, Tensor other, float rtol=1e-05, float atol=1e-08, bool equal_nan=False) -> Tensor acl_op: all_version op_api: all_version gen_opapi: out: size: 'isclose_output_size(self, other, rtol, atol, equal_nan)' # 修改点 dtype: at::kBool exec: aclnnIsClose ``` 2.在op-plugin/op_plugin/utils/KernelNpuOutputSize.h和op-plugin/op_plugin/utils/KernelNpuOutputSize.cpp中添加isclose_output_size函数的声明和实现，infer size复用之前写的逻辑并添加check。验证效果： ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: atol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, -0.1, 0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, 0.1) tensor([[True, True], [True, True]], device='npu:0') ``` # 【资料变更】不涉及 # 【接口变更】不涉及 # 【功能验证】添加报错信息 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [ ] 代码注释完备，正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4492	2 个月前
OpAdapter.h	!1713 fix ops * fix ops	1 年前
OpConstants.h	!1242 Update copyright * Update copyright	2 年前
OpUtils.cpp	[fix] Enable cube_math_type passthrough for matmul-related ops Co-authored-by: adelaideliu<adelaideliu@163.com> # message auto-generated for no-merge-commit merge: !4619 merge 26.0.0_cube_math_type into 26.0.0 [fix] Enable cube_math_type passthrough for matmul-related ops Created-by: adelaideliu Commit-by: adelaideliu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 aclnnAddmv, aclnnAddbmm, aclnnBaddbmm, aclnnInplaceAddbmm, aclnnInplaceBaddbmm, aclnnBatchMatMul, aclnnBatchMatMulWeightNz, aclnnFusedMatmul, aclnnGemm, aclnnAddmm, aclnnInplaceAddmm, aclnnAddmmWeightNz, aclnnMatmul, aclnnMatmulWeightNz, aclnnMm, aclnnMv, aclnnTransposeBatchMatMul, aclnnTransposeBatchMatMulWeightNz增加cube_math_type接口 # 【资料变更】 “不涉及” # 【接口变更】不涉及 # 【功能验证】 ![image.png](https://raw.gitcode.com/user-images/assets/7403085/36d4561d-b667-47b7-af51-0d0907e9d125/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [ ] 代码注释完备，正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4619	1 个月前
OpUtils.h	[fix] Enable cube_math_type passthrough for matmul-related ops Co-authored-by: adelaideliu<adelaideliu@163.com> # message auto-generated for no-merge-commit merge: !4619 merge 26.0.0_cube_math_type into 26.0.0 [fix] Enable cube_math_type passthrough for matmul-related ops Created-by: adelaideliu Commit-by: adelaideliu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 aclnnAddmv, aclnnAddbmm, aclnnBaddbmm, aclnnInplaceAddbmm, aclnnInplaceBaddbmm, aclnnBatchMatMul, aclnnBatchMatMulWeightNz, aclnnFusedMatmul, aclnnGemm, aclnnAddmm, aclnnInplaceAddmm, aclnnAddmmWeightNz, aclnnMatmul, aclnnMatmulWeightNz, aclnnMm, aclnnMv, aclnnTransposeBatchMatMul, aclnnTransposeBatchMatMulWeightNz增加cube_math_type接口 # 【资料变更】 “不涉及” # 【接口变更】不涉及 # 【功能验证】 ![image.png](https://raw.gitcode.com/user-images/assets/7403085/36d4561d-b667-47b7-af51-0d0907e9d125/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [ ] 代码注释完备，正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4619	1 个月前
Version.h	Checkout v2r12 Co-authored-by: chenkun<chenkun82@huawei.com> # message auto-generated for no-merge-commit merge: !4499 merge add_v2r12 into master Checkout v2r12 Created-by: kuhn7 Commit-by: chenkun Merged-by: ascend-robot Description: # 【合入来源】 checkout v2r12 for pta upgrade See merge request: Ascend/op-plugin!4499	2 个月前
op_api_common.cpp	[26.0]fix stream in workspace for EXEC_EXT Co-authored-by: DaiFu<daifu2@huawei.com> # message auto-generated for no-merge-commit merge: !4895 merge 26.0.0 into 26.0.0 [26.0]fix stream in workspace for EXEC_EXT Created-by: daifu1234567 Commit-by: DaiFu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现，涉及哪些组件之间进行交互，可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR，需要补充详细设计文档（说明上下游组件关系、时序图、类图、DFX能力等内容） EXEC_NPU_CMD_V1_EXT及EXEC_NPU_CMD_V2_EXT中workspace申请修正 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景，测试方法。如果本次测试方式与常规单元测试不同，请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护，并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4895	26 天前
op_api_common.h	init_routing 310P切换aclnnMoeInitRoutingV2 Co-authored-by: gcw_kTZ5XeTb<2491900587@qq.com> # message auto-generated for no-merge-commit merge: !4515 merge master into master init_routing 310P切换aclnnMoeInitRoutingV2 Created-by: gcw_kTZ5XeTb Commit-by: gcw_kTZ5XeTb Merged-by: ascend-robot Description: 本PR适配310P Moe的场景，原pta的接口npu_moe_init_routing_v2在310P上会调用aclnnMoeInitRoutingV3算子，由于aclnnMoeInitRoutingV3算子只能支持expert=512，hidden_size=2048，无法满足计算的MOE场景需求，经过方案评审与评估，在PTA层根据硬件SOC 仅在310P特定场景下采用aclnnMoeInitRoutingV2算子，不影响其他硬件实现 # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】原pta的接口npu_moe_init_routing_v2在310P经常下调用aclnnMoeInitRoutingV3算子转为aclnnMoeInitRoutingV2算子 # 【资料变更】不涉及 # 【接口变更】不涉及 # 【功能验证】验证正常 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [ ] 代码注释完备，正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4515	2 个月前
op_api_common_base.h	[26.0]fix stream in workspace for EXEC_EXT Co-authored-by: DaiFu<daifu2@huawei.com> # message auto-generated for no-merge-commit merge: !4895 merge 26.0.0 into 26.0.0 [26.0]fix stream in workspace for EXEC_EXT Created-by: daifu1234567 Commit-by: DaiFu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现，涉及哪些组件之间进行交互，可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR，需要补充详细设计文档（说明上下游组件关系、时序图、类图、DFX能力等内容） EXEC_NPU_CMD_V1_EXT及EXEC_NPU_CMD_V2_EXT中workspace申请修正 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景，测试方法。如果本次测试方式与常规单元测试不同，请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护，并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4895	26 天前
op_log.cpp	!2789 [DFX] Delete skip in op_log Merge pull request !2789 from 刘嘉巍/log	10 个月前
op_log.h	Revert "EXEC_NPU_CMD_EXT解耦，保持ABI兼容" Co-authored-by: chujinjin<chujinjin52@huawei.com> # message auto-generated for no-merge-commit merge: !4734 merge revert_npu_cpp_extention_for_26 into 26.0.0 Revert "EXEC_NPU_CMD_EXT解耦，保持ABI兼容" Created-by: chujinjin Commit-by: chujinjin Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现，涉及哪些组件之间进行交互，可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR，需要补充详细设计文档（说明上下游组件关系、时序图、类图、DFX能力等内容）原有头文件将内部组件的头文件暴露给外部，EXEC_NPU_CMD_EXT解耦导致部分将无关头文件去除，导致外部需要的头文件缺失。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景，测试方法。如果本次测试方式与常规单元测试不同，请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护，并补充测试自验证截图编译examples里面的aclnn_extention，编译执行通过 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4734	1 个月前
op_log_utils.h	fixed:修复FakeTensor的日志打印导致coredump Co-authored-by: ygshen<ygshen@qq.com> # message auto-generated for no-merge-commit merge: !4496 merge master into master fixed:修复FakeTensor的日志打印导致coredump Created-by: ygshen Commit-by: ygshen Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 FakeTensor的日志打印导致coredump ![image.png](https://raw.gitcode.com/user-images/assets/7403085/e64ac2ce-60d7-4c30-b396-d80ea0942f15/image.png 'image.png') 复现脚本： import os os.environ["TORCH_LOGS"] = "+all" import torch import torch.nn.functional as F def softmax_func(x): return F.softmax(x, dim=-1) compiled_softmax = torch.compile(softmax_func, backend='npugraphs') if __name__ == "__main__": x = torch.randn(4, 10, device="npu", dtype=torch.float32) output = compiled_softmax(x) sum_per_row = output.sum(dim=-1) print("\nSoftmax:\n", sum_per_row) 修复方案： FakeTensor场景不打印tensor desc. # 【资料变更】不涉及 # 【接口变更】不涉及 # 【功能验证】修复后，验证通过，不会coredump，并且打印Faketensor相关信息： ![image.png](https://raw.gitcode.com/user-images/assets/7403085/19471aec-8eb5-4d00-9527-ae1573e9922e/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4496	2 个月前
ops.cpp	!2284 Clean code Merge pull request !2284 from wgb/clean_code	1 年前