文件最后提交记录最后更新时间
[Inductor] AOTI refactor, cpp_wrapper&aoti support c shim Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !36534 merge v2.7.1-dev into v2.7.1 [Inductor] AOTI refactor, cpp_wrapper&aoti support c shim Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 https://gitcode.com/Ascend/pytorch/issues/2099?ref=&did=4045338#tid-4045338 # 【修改方案】 1. refactor AOTI codes 2. add aoti shim update code for torchnpugen, generate header file of npu fallback kernel 3. add c shim for AOTI and cpp_wrapper # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci pass # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!365349 天前
[fix]multi stream bug Co-authored-by: zhoujinning<zhoujinning2@huawei.com> # message auto-generated for no-merge-commit merge: !34811 merge v2.7.1_7 into v2.7.1 [fix]multi stream bug Created-by: zhoujinning Commit-by: zhoujinning Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!348111 个月前
[Inductor] AOTI refactor, cpp_wrapper&aoti support c shim Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !36534 merge v2.7.1-dev into v2.7.1 [Inductor] AOTI refactor, cpp_wrapper&aoti support c shim Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 https://gitcode.com/Ascend/pytorch/issues/2099?ref=&did=4045338#tid-4045338 # 【修改方案】 1. refactor AOTI codes 2. add aoti shim update code for torchnpugen, generate header file of npu fallback kernel 3. add c shim for AOTI and cpp_wrapper # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci pass # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!365349 天前
[Inductor] remove triton dependency for mlir/dvm backend Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !33764 merge v2.7.1-dev into v2.7.1 [Inductor] remove triton dependency for mlir/dvm backend Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: # 【合入来源】 issue from mlir/dvm backend error - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 1. clear _inductor/codegen/__init__.py, move all patch to other file # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci passes # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337641 个月前
[Inductor] remove triton dependency for mlir/dvm backend Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !33764 merge v2.7.1-dev into v2.7.1 [Inductor] remove triton dependency for mlir/dvm backend Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: # 【合入来源】 issue from mlir/dvm backend error - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 1. clear _inductor/codegen/__init__.py, move all patch to other file # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci passes # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337641 个月前
[fix]dvm-triton_wrap Co-authored-by: cuiduo<cuiduo1@huawei.com> # message auto-generated for no-merge-commit merge: !35674 merge v2.7.1 into v2.7.1 [fix]dvm-triton_wrap Created-by: cuiduo Commit-by: cuiduo Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 支持dvm模式下自定义算子入图实现,在dvm分支下添加部分triton patch,以实现算子入图 # 【资料变更】 >不涉及 # 【接口变更】 > 不涉及 # 【功能验证】 > 已补充UT用例 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!3567416 天前
[Inductor] refactor inductor Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !30965 merge v2.7.1-dev into v2.7.1 [Inductor] refactor inductor Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: # 【合入来源】 Inductor Refactor - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [x] 重构优化 - [ ] 资料更新 # 【修改方案】 1. remove some useless patch like inductor meta. 2. remove runtime.py and move patch func into runtime folder 3. move device_op_overrides into codegen/npu to fork community 4. remove AOTI debug config, remove useless patch 5. speed up triton kernel run() # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci passes # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!309651 个月前
[Inductor] NPUTritonScheduling no more support BackendFeature.FOREACH Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !36908 merge v2.7.1-tmp into v2.7.1 [Inductor] NPUTritonScheduling no more support BackendFeature.FOREACH Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 https://gitcode.com/Ascend/pytorch/issues/2099?ref=&did=4045338#tid-4045338 # 【修改方案】 1. bugfix for npu_fallback_list 2. remove feature FOREACH for NPUTritonScheduling 3. fix alignment for cpp_wrapper kernel launch # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci pass # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!369087 天前
[Inductor] remove useless cat api and raise Runtime error for linear meets cat Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !35015 merge v2.7.1-dev into v2.7.1 [Inductor] remove useless cat api and raise Runtime error for linear meets cat Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 A5 DLRM model - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 1. remove useless cat api (cat_store and cat_insert_slice) 2. replace continue with raise Runtime error when linear meets variable not in range_tree_nodes or range_tree_nodes_removed # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci pass # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!3501527 天前
[inductor][acc_tool]fix ZJ model Co-authored-by: AACAES<liuyan7892@163.com> # message auto-generated for no-merge-commit merge: !35016 merge v2.7.1 into v2.7.1 [inductor][acc_tool]fix ZJ model Created-by: AACAES Commit-by: AACAES Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 1. ir_fx.py: 传递traced_graph/node_name -->_patch_Reduction_create_multilayer_helper ,_patch_Reduction_create_multilayer 2. LOWERING_OVERRIDE_OP: fallbacklist中的不用删,(或者把fallback 移到最后) 3. fallback 后移:在精度工具重新register后再fallback,例empty,避免fallback后又被register,(可以移到文件最后吧,感觉更保险一点) 4. fake_input.npu():scalar 转到npu上 5. fx_arg_shapes 中u* 等符号不用参与比对,但需再后续输入输出参数对应时记录mapping;同时应用alias映射到同一buf再进行参数set对比(需要对家里模型进行验证) 6. kernel_call_args中SymbolicCallArg需要先map_operators_to_strings对齐fx中的符号记录 7. str(element):动态shape type不能做key,转str参与映射 8. is_dynamic_shape_dim:规避动态shape 字符被写进脚本,此处这样规避,但不会进行reshape数据对齐了 9. torch.Tensor(arg).npu():float包成scalar 标量并转到npu,解报错 10. aten.reciprocal:对齐原始lowering行为 11. not traced_graph_hash 时return None:手写算子不用dump 12. HeuristicType.USER_AUTOTUNE 表示手写算子,不用对比精度 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 ZJ现场已验证;torchbench 6个模型自验ok # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!3501613 天前
[inductor] Fix DecisionTransform codegen bug caused by unified-axis mechanism Co-authored-by: 魏展<weizhan4@huawei.com> # message auto-generated for no-merge-commit merge: !33709 merge decisiontransform-codegen-fix into v2.7.1 [inductor] Fix DecisionTransform codegen bug caused by unified-axis mechanism Created-by: weizhan4 Commit-by: 魏展 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337091 个月前
[Inductor] AOTI refactor, cpp_wrapper&aoti support c shim Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !36534 merge v2.7.1-dev into v2.7.1 [Inductor] AOTI refactor, cpp_wrapper&aoti support c shim Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 https://gitcode.com/Ascend/pytorch/issues/2099?ref=&did=4045338#tid-4045338 # 【修改方案】 1. refactor AOTI codes 2. add aoti shim update code for torchnpugen, generate header file of npu fallback kernel 3. add c shim for AOTI and cpp_wrapper # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci pass # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!365349 天前
[Inductor] refactor inductor Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !30965 merge v2.7.1-dev into v2.7.1 [Inductor] refactor inductor Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: # 【合入来源】 Inductor Refactor - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [x] 重构优化 - [ ] 资料更新 # 【修改方案】 1. remove some useless patch like inductor meta. 2. remove runtime.py and move patch func into runtime folder 3. move device_op_overrides into codegen/npu to fork community 4. remove AOTI debug config, remove useless patch 5. speed up triton kernel run() # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci passes # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!309651 个月前
[Inductor] NPUTritonScheduling no more support BackendFeature.FOREACH Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !36908 merge v2.7.1-tmp into v2.7.1 [Inductor] NPUTritonScheduling no more support BackendFeature.FOREACH Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 https://gitcode.com/Ascend/pytorch/issues/2099?ref=&did=4045338#tid-4045338 # 【修改方案】 1. bugfix for npu_fallback_list 2. remove feature FOREACH for NPUTritonScheduling 3. fix alignment for cpp_wrapper kernel launch # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci pass # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!369087 天前
feat(inductor): add grouped symbolic autotune Co-authored-by: Xuan Peng<pengxuan9@huawei.com> # message auto-generated for no-merge-commit merge: !36593 merge feat/symbolic-grouped-autotune into v2.7.1 feat(inductor): add grouped symbolic autotune Created-by: HinPeng Commit-by: Xuan Peng Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> ## Summary This PR adds grouped symbolic autotuning for Inductor-Triton kernels. Instead of autotuning the symbolic shape using the size_hints (current size), it groups shape ranges into buckets according to schedule template and reuses the best kernel variant within each group. This change will slightly increase autotune overhead for symbolic kernel, but preserving shape-aware kernel selection. ## What changed - Added grouped symbolic autotune metadata and runtime planning in symbolic_grouping.py - Extended split/tiling analysis to identify eligible symbolic kernels and build grouping features - Updated Triton codegen to emit grouped kernel metadata and runtime block arguments - Added grouped grid construction and runtime launcher selection in triton_heuristics.py - Introduced rollout switches: - INDUCTOR_ASCEND_SYMBOLIC_GROUP_AUTOTUNE - INDUCTOR_ASCEND_SYMBOLIC_GROUP_TEMPLATES ## Notes - The feature is gated behind config flags for controlled rollout - Initial support targets pointwise, reduction, and persistent_reduction templates - Unsupported grouped plans automatically fall back to the existing autotune path # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!365937 天前
[Inductor] cat community solution Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !33613 merge v2.7.1-cat into v2.7.1 [Inductor] cat community solution Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: # 【合入来源】 cat community soluton - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [x] 重构优化 - [ ] 资料更新 # 【修改方案】 1. make cat follow pytorch community solution, remove exist insert_slice/extract_slice and cat_store implement, but currently support A5, A2 A3 cat lowering will be supported soon 2. move decide_codegen_dims_in_kernel into NPUIndexTritonKernel 3. NPUCombinedScheduling now extern CUDACombinedScheduling, remove useless override function 4. bugfix for decide_codegen_dims_in_kernel when var not in range_tree_nodes_removed 5. change reduction line from post_loop_store to post_loop_combine # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci passes # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!336131 个月前
[bugfix] fix simt only codegen Co-authored-by: luqichao<luqichao1@huawei.com> # message auto-generated for no-merge-commit merge: !37472 merge bugfix/symbolic_simt_codegen_1 into v2.7.1 [bugfix] fix simt only codegen Created-by: luqichao Commit-by: luqichao Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!374721 天前
[Inductor] cat support kernels split Y axis and bugfix for cpp_wrapper Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !36085 merge v2.7.1-dev into v2.7.1 [Inductor] cat support kernels split Y axis and bugfix for cpp_wrapper Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 https://gitcode.com/Ascend/pytorch/issues/1990?ref=&did=4029765#tid-4029765 - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 1. bugfix for generate_save_uncompiled_kernels function in 2. add correct clone_preserve_strides imports for wrapper.py 3. for lowering aten.cat, we never use mask+where solution 4. add aten.cat into LOWERING_OVERRIDE_OP, then remove it from INDIRECT_MEM_FALLBACK_LIST, now cat can lowering on A2/A3 device 5. remove docs for USE_STORE_IN_CAT environment param 6. add support of cat combo kernel with Y split # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci pass # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!3608515 天前
离散访存代码整改 Co-authored-by: shenyixuan1<sheny1xuan@163.com> # message auto-generated for no-merge-commit merge: !29599 merge tiling_fix into v2.7.1 离散访存代码整改 Created-by: shenyixuan1 Commit-by: shenyixuan1 Merged-by: ascend-robot Description: 1. 删除冗余环境变量,离散访存保留1个环境变量INDUCTOR_INDIRECT_MEMORY_MODE:可选范围为(simd_simt_mix)、simt_template、simt_only、simd_simt_mix 2. 新增对simd_simt_mix模式下tiling的选择,支持相同dsl情况下模板、纯simt、simd的autotune See merge request: Ascend/pytorch!295994 个月前
/lgtm Co-authored-by: kkjocker<hexuanyu1@huawei.com> # message auto-generated for no-merge-commit merge: !37220 merge v2.7.1_fix into v2.7.1 【bugfix】fix NPUWrapperCodeGen.create using none-parameter super() Created-by: kkjocker Commit-by: kkjocker Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> https://gitcode.com/Ascend/pytorch/issues/1962 # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 修复 ![image.png](https://raw.gitcode.com/user-images/assets/7404318/e11496c8-b49a-4623-ad72-3d89cbdd9a7b/image.png 'image.png') 原本是非法零参导致的TypeError,修复方案为新增NPUSubgraphPythonWrapperCodegen继承SubgraphPythonWrapperCodegen,并实现generate_node_numel_expr,改后用例通过: ![image.png](https://raw.gitcode.com/user-images/assets/7404318/834b8ee5-8980-4527-9fda-f91f7508b8f3/image.png 'image.png') # 【资料变更】 > 不涉及 # 【接口变更】 > 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!372203 天前