Fork
0
代码
介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
Fork
0
26.0.0
op-plugin
/
op_plugin
/
utils
下载当前目录
ascend-robot
[26.0]fix stream in workspace for EXEC_EXT
ceeca1c6
创建于
26 天前
历史提交
文件
最后提交记录
最后更新时间
custom_functions
fix:修复aclgraph场景下fa算子在replay阶段无法控核 Co-authored-by: ChengLyric<licheng236@huawei.com> # message auto-generated for no-merge-commit merge:
!4617
merge 26.0.0_fix_fia_core into 26.0.0 fix:修复aclgraph场景下fa算子在replay阶段无法控核 Created-by: Guanam2020 Commit-by: ChengLyric Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 在fa算子计算max workspace时调用use接口设置线程变量 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 A2、A5问题场景已验证ok # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4617
1 个月前
AdvancedIndex.cpp
!2596
[DFX] More detail info in op_log and support common OP_LOG. Merge pull request
!2596
from 刘嘉巍/master-dev
11 个月前
AdvancedIndex.h
!2284
Clean code Merge pull request
!2284
from wgb/clean_code
1 年前
Export.h
!1242
Update copyright * Update copyright
2 年前
KernelNpuNewParams.cpp
!2595
[Feature] Support npu_add_rms_norm_quant. Merge pull request
!2595
from 刘嘉巍/log
11 个月前
KernelNpuNewParams.h
!2595
[Feature] Support npu_add_rms_norm_quant. Merge pull request
!2595
from 刘嘉巍/log
11 个月前
KernelNpuOutputDtype.cpp
feat: 新增DC算子Setup/Teardown新接口 Co-authored-by: tongzy1242<tongzeyun@huawei.com> # message auto-generated for no-merge-commit merge:
!4468
merge new_op_urma into master feat: 新增DC算子Setup/Teardown新接口 Created-by: tongzy1242 Commit-by: tongzy1242 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> Issue [
#892
](
https://gitcode.com/cann/ops-transformer/issues/892)
- [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 具体实现包括:1)在YAML配置文件中注册算子并配置ACL接口;2)在Python端添加元函数,用于编译时的形状和数据类型推断;3)在C++端实现输出形状和数据类型(如FLOAT8_E8M0)的动态计算逻辑;4)在算子注册配置(JSON)中补充接口签名;5)新增了FakeTensor模式下的元数据测试和多进程分布式环境下的功能集成测试,以验证算子链路的正确性。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 本次修改在算子插件框架中新增了四个算子定义:npu_moe_distribute_dispatch_setup、npu_moe_distribute_dispatch_teardown、npu_moe_distribute_combine_setup和npu_moe_distribute_combine_teardown。 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 已本地自验证 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4468
2 个月前
KernelNpuOutputDtype.h
feat: 新增DC算子Setup/Teardown新接口 Co-authored-by: tongzy1242<tongzeyun@huawei.com> # message auto-generated for no-merge-commit merge:
!4468
merge new_op_urma into master feat: 新增DC算子Setup/Teardown新接口 Created-by: tongzy1242 Commit-by: tongzy1242 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> Issue [
#892
](
https://gitcode.com/cann/ops-transformer/issues/892)
- [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 具体实现包括:1)在YAML配置文件中注册算子并配置ACL接口;2)在Python端添加元函数,用于编译时的形状和数据类型推断;3)在C++端实现输出形状和数据类型(如FLOAT8_E8M0)的动态计算逻辑;4)在算子注册配置(JSON)中补充接口签名;5)新增了FakeTensor模式下的元数据测试和多进程分布式环境下的功能集成测试,以验证算子链路的正确性。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 本次修改在算子插件框架中新增了四个算子定义:npu_moe_distribute_dispatch_setup、npu_moe_distribute_dispatch_teardown、npu_moe_distribute_combine_setup和npu_moe_distribute_combine_teardown。 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 已本地自验证 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4468
2 个月前
KernelNpuOutputSize.cpp
[fix] isclose rtol和atol添加check Co-authored-by: maoyuanpeng1<maoyuanpeng@huawei.com> # message auto-generated for no-merge-commit merge:
!4492
merge br_fix_isclose_infer_size into master [fix] isclose rtol和atol添加check Created-by: maoyuanpeng1 Commit-by: maoyuanpeng1 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 >
https://gitcode.com/Ascend/pytorch/issues/1570
- [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 torch.isclose算子 未对 rtol和atol进行校验,rtol和atol为负数时应该报错。 **复现脚本:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) # 应该报错,但没有 tensor([[True, True], [True, True]], device='npu:0') ``` **方案:** isclose算子使用 gen_opapi自动生成下发逻辑。故可以在
infer size
的时候添加校验逻辑。 1.在op_plugin_functions.yaml 修改isclose算子gen_opapi size字段的内容。 ```yaml - func: isclose(Tensor self, Tensor other, float rtol=1e-05, float atol=1e-08, bool equal_nan=False) -> Tensor acl_op: all_version op_api: all_version gen_opapi: out: size: 'isclose_output_size(self, other, rtol, atol, equal_nan)' # 修改点 dtype: at::kBool exec: aclnnIsClose ``` 2.在op-plugin/op_plugin/utils/KernelNpuOutputSize.h和op-plugin/op_plugin/utils/KernelNpuOutputSize.cpp中添加isclose_output_size函数的声明和实现,infer size复用之前写的逻辑并添加check。 **验证效果:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: atol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, -0.1, 0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, 0.1) tensor([[True, True], [True, True]], device='npu:0') ``` # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 添加报错信息 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4492
2 个月前
KernelNpuOutputSize.h
[fix] isclose rtol和atol添加check Co-authored-by: maoyuanpeng1<maoyuanpeng@huawei.com> # message auto-generated for no-merge-commit merge:
!4492
merge br_fix_isclose_infer_size into master [fix] isclose rtol和atol添加check Created-by: maoyuanpeng1 Commit-by: maoyuanpeng1 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 >
https://gitcode.com/Ascend/pytorch/issues/1570
- [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 torch.isclose算子 未对 rtol和atol进行校验,rtol和atol为负数时应该报错。 **复现脚本:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) # 应该报错,但没有 tensor([[True, True], [True, True]], device='npu:0') ``` **方案:** isclose算子使用 gen_opapi自动生成下发逻辑。故可以在
infer size
的时候添加校验逻辑。 1.在op_plugin_functions.yaml 修改isclose算子gen_opapi size字段的内容。 ```yaml - func: isclose(Tensor self, Tensor other, float rtol=1e-05, float atol=1e-08, bool equal_nan=False) -> Tensor acl_op: all_version op_api: all_version gen_opapi: out: size: 'isclose_output_size(self, other, rtol, atol, equal_nan)' # 修改点 dtype: at::kBool exec: aclnnIsClose ``` 2.在op-plugin/op_plugin/utils/KernelNpuOutputSize.h和op-plugin/op_plugin/utils/KernelNpuOutputSize.cpp中添加isclose_output_size函数的声明和实现,infer size复用之前写的逻辑并添加check。 **验证效果:** ```python >>> import torch >>> x = torch.rand(2, 2, device='npu') >>> torch.isclose(x, x, -0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, -0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: atol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, -0.1, 0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> RuntimeError: rtol must be greater than or equal to zero, but got -0.1 >>> torch.isclose(x, x, 0.1, 0.1) tensor([[True, True], [True, True]], device='npu:0') ``` # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 添加报错信息 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4492
2 个月前
OpAdapter.h
!1713
fix ops * fix ops
1 年前
OpConstants.h
!1242
Update copyright * Update copyright
2 年前
OpUtils.cpp
[fix] Enable cube_math_type passthrough for matmul-related ops Co-authored-by: adelaideliu<adelaideliu@163.com> # message auto-generated for no-merge-commit merge:
!4619
merge 26.0.0_cube_math_type into 26.0.0 [fix] Enable cube_math_type passthrough for matmul-related ops Created-by: adelaideliu Commit-by: adelaideliu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 aclnnAddmv, aclnnAddbmm, aclnnBaddbmm, aclnnInplaceAddbmm, aclnnInplaceBaddbmm, aclnnBatchMatMul, aclnnBatchMatMulWeightNz, aclnnFusedMatmul, aclnnGemm, aclnnAddmm, aclnnInplaceAddmm, aclnnAddmmWeightNz, aclnnMatmul, aclnnMatmulWeightNz, aclnnMm, aclnnMv, aclnnTransposeBatchMatMul, aclnnTransposeBatchMatMulWeightNz增加cube_math_type接口 # 【资料变更】 “不涉及” # 【接口变更】 不涉及 # 【功能验证】  # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4619
1 个月前
OpUtils.h
[fix] Enable cube_math_type passthrough for matmul-related ops Co-authored-by: adelaideliu<adelaideliu@163.com> # message auto-generated for no-merge-commit merge:
!4619
merge 26.0.0_cube_math_type into 26.0.0 [fix] Enable cube_math_type passthrough for matmul-related ops Created-by: adelaideliu Commit-by: adelaideliu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 aclnnAddmv, aclnnAddbmm, aclnnBaddbmm, aclnnInplaceAddbmm, aclnnInplaceBaddbmm, aclnnBatchMatMul, aclnnBatchMatMulWeightNz, aclnnFusedMatmul, aclnnGemm, aclnnAddmm, aclnnInplaceAddmm, aclnnAddmmWeightNz, aclnnMatmul, aclnnMatmulWeightNz, aclnnMm, aclnnMv, aclnnTransposeBatchMatMul, aclnnTransposeBatchMatMulWeightNz增加cube_math_type接口 # 【资料变更】 “不涉及” # 【接口变更】 不涉及 # 【功能验证】  # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4619
1 个月前
Version.h
Checkout v2r12 Co-authored-by: chenkun<chenkun82@huawei.com> # message auto-generated for no-merge-commit merge:
!4499
merge add_v2r12 into master Checkout v2r12 Created-by: kuhn7 Commit-by: chenkun Merged-by: ascend-robot Description: # 【合入来源】 checkout v2r12 for pta upgrade See merge request: Ascend/op-plugin
!4499
2 个月前
op_api_common.cpp
[26.0]fix stream in workspace for EXEC_EXT Co-authored-by: DaiFu<daifu2@huawei.com> # message auto-generated for no-merge-commit merge:
!4895
merge 26.0.0 into 26.0.0 [26.0]fix stream in workspace for EXEC_EXT Created-by: daifu1234567 Commit-by: DaiFu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) EXEC_NPU_CMD_V1_EXT及EXEC_NPU_CMD_V2_EXT中workspace申请修正 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4895
26 天前
op_api_common.h
init_routing 310P切换aclnnMoeInitRoutingV2 Co-authored-by: gcw_kTZ5XeTb<2491900587@qq.com> # message auto-generated for no-merge-commit merge:
!4515
merge master into master init_routing 310P切换aclnnMoeInitRoutingV2 Created-by: gcw_kTZ5XeTb Commit-by: gcw_kTZ5XeTb Merged-by: ascend-robot Description: 本PR适配310P Moe的场景,原pta的接口npu_moe_init_routing_v2在310P上会调用aclnnMoeInitRoutingV3算子,由于aclnnMoeInitRoutingV3算子只能支持expert=512,hidden_size=2048,无法满足计算的MOE场景需求,经过方案评审与评估,在PTA层根据硬件SOC 仅在310P特定场景下采用aclnnMoeInitRoutingV2算子,不影响其他硬件实现 # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 原pta的接口npu_moe_init_routing_v2在310P经常下调用aclnnMoeInitRoutingV3算子转为aclnnMoeInitRoutingV2算子 # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 验证正常 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4515
2 个月前
op_api_common_base.h
[26.0]fix stream in workspace for EXEC_EXT Co-authored-by: DaiFu<daifu2@huawei.com> # message auto-generated for no-merge-commit merge:
!4895
merge 26.0.0 into 26.0.0 [26.0]fix stream in workspace for EXEC_EXT Created-by: daifu1234567 Commit-by: DaiFu Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) EXEC_NPU_CMD_V1_EXT及EXEC_NPU_CMD_V2_EXT中workspace申请修正 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4895
26 天前
op_log.cpp
!2789
[DFX] Delete skip in op_log Merge pull request
!2789
from 刘嘉巍/log
10 个月前
op_log.h
Revert "EXEC_NPU_CMD_EXT解耦,保持ABI兼容" Co-authored-by: chujinjin<chujinjin52@huawei.com> # message auto-generated for no-merge-commit merge:
!4734
merge revert_npu_cpp_extention_for_26 into 26.0.0 Revert "EXEC_NPU_CMD_EXT解耦,保持ABI兼容" Created-by: chujinjin Commit-by: chujinjin Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 原有头文件将内部组件的头文件暴露给外部,EXEC_NPU_CMD_EXT解耦导致部分将无关头文件去除,导致外部需要的头文件缺失。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 编译examples里面的aclnn_extention,编译执行通过 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4734
1 个月前
op_log_utils.h
fixed:修复FakeTensor的日志打印导致coredump Co-authored-by: ygshen<ygshen@qq.com> # message auto-generated for no-merge-commit merge:
!4496
merge master into master fixed:修复FakeTensor的日志打印导致coredump Created-by: ygshen Commit-by: ygshen Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 FakeTensor的日志打印导致coredump  复现脚本: import os os.environ["TORCH_LOGS"] = "+all" import torch import torch.nn.functional as F def softmax_func(x): return F.softmax(x, dim=-1) compiled_softmax = torch.compile(softmax_func, backend='npugraphs') if __name__ == "__main__": x = torch.randn(4, 10, device="npu", dtype=torch.float32) output = compiled_softmax(x) sum_per_row = output.sum(dim=-1) print("\nSoftmax:\n", sum_per_row) 修复方案: FakeTensor场景不打印tensor desc. # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 修复后,验证通过,不会coredump,并且打印Faketensor相关信息:  # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/op-plugin
!4496
2 个月前
ops.cpp
!2284
Clean code Merge pull request
!2284
from wgb/clean_code
1 年前