文件最后提交记录最后更新时间
fix:修复aclgraph场景下fa算子在replay阶段无法控核 Co-authored-by: ChengLyric<licheng236@huawei.com> # message auto-generated for no-merge-commit merge: !4617 merge 26.0.0_fix_fia_core into 26.0.0 fix:修复aclgraph场景下fa算子在replay阶段无法控核 Created-by: Guanam2020 Commit-by: ChengLyric Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 在fa算子计算max workspace时调用use接口设置线程变量 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 A2、A5问题场景已验证ok # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!46171 个月前
!2596 [DFX] More detail info in op_log and support common OP_LOG. Merge pull request !2596 from 刘嘉巍/master-dev 11 个月前
!2284 Clean code Merge pull request !2284 from wgb/clean_code 1 年前
!1242 Update copyright * Update copyright 2 年前
!2595 [Feature] Support npu_add_rms_norm_quant. Merge pull request !2595 from 刘嘉巍/log 11 个月前
!2595 [Feature] Support npu_add_rms_norm_quant. Merge pull request !2595 from 刘嘉巍/log 11 个月前
feat: 新增DC算子Setup/Teardown新接口 Co-authored-by: tongzy1242<tongzeyun@huawei.com> # message auto-generated for no-merge-commit merge: !4468 merge new_op_urma into master feat: 新增DC算子Setup/Teardown新接口 Created-by: tongzy1242 Commit-by: tongzy1242 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> Issue [#892](https://gitcode.com/cann/ops-transformer/issues/892) - [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 具体实现包括:1)在YAML配置文件中注册算子并配置ACL接口;2)在Python端添加元函数,用于编译时的形状和数据类型推断;3)在C++端实现输出形状和数据类型(如FLOAT8_E8M0)的动态计算逻辑;4)在算子注册配置(JSON)中补充接口签名;5)新增了FakeTensor模式下的元数据测试和多进程分布式环境下的功能集成测试,以验证算子链路的正确性。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 本次修改在算子插件框架中新增了四个算子定义:npu_moe_distribute_dispatch_setup、npu_moe_distribute_dispatch_teardown、npu_moe_distribute_combine_setup和npu_moe_distribute_combine_teardown。 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 已本地自验证 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!44682 个月前
feat: 新增DC算子Setup/Teardown新接口 Co-authored-by: tongzy1242<tongzeyun@huawei.com> # message auto-generated for no-merge-commit merge: !4468 merge new_op_urma into master feat: 新增DC算子Setup/Teardown新接口 Created-by: tongzy1242 Commit-by: tongzy1242 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> Issue [#892](https://gitcode.com/cann/ops-transformer/issues/892) - [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 具体实现包括:1)在YAML配置文件中注册算子并配置ACL接口;2)在Python端添加元函数,用于编译时的形状和数据类型推断;3)在C++端实现输出形状和数据类型(如FLOAT8_E8M0)的动态计算逻辑;4)在算子注册配置(JSON)中补充接口签名;5)新增了FakeTensor模式下的元数据测试和多进程分布式环境下的功能集成测试,以验证算子链路的正确性。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 本次修改在算子插件框架中新增了四个算子定义:npu_moe_distribute_dispatch_setup、npu_moe_distribute_dispatch_teardown、npu_moe_distribute_combine_setup和npu_moe_distribute_combine_teardown。 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 已本地自验证 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!44682 个月前
[fix] isclose rtol和atol添加check Co-authored-by: maoyuanpeng1<maoyuanpeng@huawei.com> # message auto-generated for no-merge-commit merge: !4492 merge br_fix_isclose_infer_size into master [fix] isclose rtol和atol添加check Created-by: maoyuanpeng1 Commit-by: maoyuanpeng1 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > https://gitcode.com/Ascend/pytorch/issues/1570 - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 torch.isclose算子 未对 rtol和atol进行校验,rtol和atol为负数时应该报错。 **复现脚本:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) # 应该报错,但没有 tensor([[True, True], [True, True]], device='npu:0') ``` **方案:** isclose算子使用 gen_opapi自动生成下发逻辑。故可以在infer size的时候添加校验逻辑。 1.在op_plugin_functions.yaml 修改isclose算子gen_opapi size字段的内容。 ```yaml - func: isclose(Tensor self, Tensor other, float rtol=1e-05, float atol=1e-08, bool equal_nan=False) -> Tensor acl_op: all_version op_api: all_version gen_opapi: out: size: 'isclose_output_size(self, other, rtol, atol, equal_nan)' # 修改点 dtype: at::kBool exec: aclnnIsClose ``` 2.在op-plugin/op_plugin/utils/KernelNpuOutputSize.h和op-plugin/op_plugin/utils/KernelNpuOutputSize.cpp中添加isclose_output_size函数的声明和实现,infer size复用之前写的逻辑并添加check。 **验证效果:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: atol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, -0.1, 0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, 0.1) tensor([[True, True], [True, True]], device='npu:0') ``` # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 添加报错信息 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!44922 个月前
[fix] isclose rtol和atol添加check Co-authored-by: maoyuanpeng1<maoyuanpeng@huawei.com> # message auto-generated for no-merge-commit merge: !4492 merge br_fix_isclose_infer_size into master [fix] isclose rtol和atol添加check Created-by: maoyuanpeng1 Commit-by: maoyuanpeng1 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > https://gitcode.com/Ascend/pytorch/issues/1570 - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 torch.isclose算子 未对 rtol和atol进行校验,rtol和atol为负数时应该报错。 **复现脚本:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) # 应该报错,但没有 tensor([[True, True], [True, True]], device='npu:0') ``` **方案:** isclose算子使用 gen_opapi自动生成下发逻辑。故可以在infer size的时候添加校验逻辑。 1.在op_plugin_functions.yaml 修改isclose算子gen_opapi size字段的内容。 ```yaml - func: isclose(Tensor self, Tensor other, float rtol=1e-05, float atol=1e-08, bool equal_nan=False) -> Tensor acl_op: all_version op_api: all_version gen_opapi: out: size: 'isclose_output_size(self, other, rtol, atol, equal_nan)' # 修改点 dtype: at::kBool exec: aclnnIsClose ``` 2.在op-plugin/op_plugin/utils/KernelNpuOutputSize.h和op-plugin/op_plugin/utils/KernelNpuOutputSize.cpp中添加isclose_output_size函数的声明和实现,infer size复用之前写的逻辑并添加check。 **验证效果:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: atol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, -0.1, 0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, 0.1) tensor([[True, True], [True, True]], device='npu:0') ``` # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 添加报错信息 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!44922 个月前
!1713 fix ops * fix ops 1 年前
!1242 Update copyright * Update copyright 2 年前
[fix] Enable cube_math_type passthrough for matmul-related ops Co-authored-by: adelaideliu<adelaideliu@163.com> # message auto-generated for no-merge-commit merge: !4619 merge 26.0.0_cube_math_type into 26.0.0 [fix] Enable cube_math_type passthrough for matmul-related ops Created-by: adelaideliu Commit-by: adelaideliu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 aclnnAddmv, aclnnAddbmm, aclnnBaddbmm, aclnnInplaceAddbmm, aclnnInplaceBaddbmm, aclnnBatchMatMul, aclnnBatchMatMulWeightNz, aclnnFusedMatmul, aclnnGemm, aclnnAddmm, aclnnInplaceAddmm, aclnnAddmmWeightNz, aclnnMatmul, aclnnMatmulWeightNz, aclnnMm, aclnnMv, aclnnTransposeBatchMatMul, aclnnTransposeBatchMatMulWeightNz增加cube_math_type接口 # 【资料变更】 “不涉及” # 【接口变更】 不涉及 # 【功能验证】 ![image.png](https://raw.gitcode.com/user-images/assets/7403085/36d4561d-b667-47b7-af51-0d0907e9d125/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!46191 个月前
[fix] Enable cube_math_type passthrough for matmul-related ops Co-authored-by: adelaideliu<adelaideliu@163.com> # message auto-generated for no-merge-commit merge: !4619 merge 26.0.0_cube_math_type into 26.0.0 [fix] Enable cube_math_type passthrough for matmul-related ops Created-by: adelaideliu Commit-by: adelaideliu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 aclnnAddmv, aclnnAddbmm, aclnnBaddbmm, aclnnInplaceAddbmm, aclnnInplaceBaddbmm, aclnnBatchMatMul, aclnnBatchMatMulWeightNz, aclnnFusedMatmul, aclnnGemm, aclnnAddmm, aclnnInplaceAddmm, aclnnAddmmWeightNz, aclnnMatmul, aclnnMatmulWeightNz, aclnnMm, aclnnMv, aclnnTransposeBatchMatMul, aclnnTransposeBatchMatMulWeightNz增加cube_math_type接口 # 【资料变更】 “不涉及” # 【接口变更】 不涉及 # 【功能验证】 ![image.png](https://raw.gitcode.com/user-images/assets/7403085/36d4561d-b667-47b7-af51-0d0907e9d125/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!46191 个月前
Checkout v2r12 Co-authored-by: chenkun<chenkun82@huawei.com> # message auto-generated for no-merge-commit merge: !4499 merge add_v2r12 into master Checkout v2r12 Created-by: kuhn7 Commit-by: chenkun Merged-by: ascend-robot Description: # 【合入来源】 checkout v2r12 for pta upgrade See merge request: Ascend/op-plugin!44992 个月前
[26.0]fix stream in workspace for EXEC_EXT Co-authored-by: DaiFu<daifu2@huawei.com> # message auto-generated for no-merge-commit merge: !4895 merge 26.0.0 into 26.0.0 [26.0]fix stream in workspace for EXEC_EXT Created-by: daifu1234567 Commit-by: DaiFu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) EXEC_NPU_CMD_V1_EXT及EXEC_NPU_CMD_V2_EXT中workspace申请修正 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!489526 天前
init_routing 310P切换aclnnMoeInitRoutingV2 Co-authored-by: gcw_kTZ5XeTb<2491900587@qq.com> # message auto-generated for no-merge-commit merge: !4515 merge master into master init_routing 310P切换aclnnMoeInitRoutingV2 Created-by: gcw_kTZ5XeTb Commit-by: gcw_kTZ5XeTb Merged-by: ascend-robot Description: 本PR适配310P Moe的场景,原pta的接口npu_moe_init_routing_v2在310P上会调用aclnnMoeInitRoutingV3算子,由于aclnnMoeInitRoutingV3算子只能支持expert=512,hidden_size=2048,无法满足计算的MOE场景需求,经过方案评审与评估,在PTA层根据硬件SOC 仅在310P特定场景下采用aclnnMoeInitRoutingV2算子,不影响其他硬件实现 # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 原pta的接口npu_moe_init_routing_v2在310P经常下调用aclnnMoeInitRoutingV3算子转为aclnnMoeInitRoutingV2算子 # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 验证正常 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!45152 个月前
[26.0]fix stream in workspace for EXEC_EXT Co-authored-by: DaiFu<daifu2@huawei.com> # message auto-generated for no-merge-commit merge: !4895 merge 26.0.0 into 26.0.0 [26.0]fix stream in workspace for EXEC_EXT Created-by: daifu1234567 Commit-by: DaiFu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) EXEC_NPU_CMD_V1_EXT及EXEC_NPU_CMD_V2_EXT中workspace申请修正 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!489526 天前
!2789 [DFX] Delete skip in op_log Merge pull request !2789 from 刘嘉巍/log 10 个月前
Revert "EXEC_NPU_CMD_EXT解耦,保持ABI兼容" Co-authored-by: chujinjin<chujinjin52@huawei.com> # message auto-generated for no-merge-commit merge: !4734 merge revert_npu_cpp_extention_for_26 into 26.0.0 Revert "EXEC_NPU_CMD_EXT解耦,保持ABI兼容" Created-by: chujinjin Commit-by: chujinjin Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 原有头文件将内部组件的头文件暴露给外部,EXEC_NPU_CMD_EXT解耦导致部分将无关头文件去除,导致外部需要的头文件缺失。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 编译examples里面的aclnn_extention,编译执行通过 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!47341 个月前
fixed:修复FakeTensor的日志打印导致coredump Co-authored-by: ygshen<ygshen@qq.com> # message auto-generated for no-merge-commit merge: !4496 merge master into master fixed:修复FakeTensor的日志打印导致coredump Created-by: ygshen Commit-by: ygshen Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 FakeTensor的日志打印导致coredump ![image.png](https://raw.gitcode.com/user-images/assets/7403085/e64ac2ce-60d7-4c30-b396-d80ea0942f15/image.png 'image.png') 复现脚本: import os os.environ["TORCH_LOGS"] = "+all" import torch import torch.nn.functional as F def softmax_func(x): return F.softmax(x, dim=-1) compiled_softmax = torch.compile(softmax_func, backend='npugraphs') if __name__ == "__main__": x = torch.randn(4, 10, device="npu", dtype=torch.float32) output = compiled_softmax(x) sum_per_row = output.sum(dim=-1) print("\nSoftmax:\n", sum_per_row) 修复方案: FakeTensor场景不打印tensor desc. # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 修复后,验证通过,不会coredump,并且打印Faketensor相关信息: ![image.png](https://raw.gitcode.com/user-images/assets/7403085/19471aec-8eb5-4d00-9527-ae1573e9922e/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin!44962 个月前
!2284 Clean code Merge pull request !2284 from wgb/clean_code 1 年前