文件最后提交记录最后更新时间
Remove the ATen operator whose participation in fusion under MLIR mode results in performance degradation Co-authored-by: zhangafei<zhangafei@huawei.com> # message auto-generated for no-merge-commit merge: !33889 merge v2.7.1-26.0.0 into v2.7.1-26.0.0 Remove the ATen operator whose participation in fusion under MLIR mode results in performance degradation Created-by: HandsoemLemon Commit-by: zhangafei Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 在运行图模式mlir后端时 aten.cat, aten.slice_scatter, aten.constant_pad_nd, aten.split, aten.split_with_sizes 参与Inductor IR lowering会导致算子性能或算子编译时间严重劣化,将其从白名单中删除,禁止其参与融合。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!338891 个月前
fix use_aclnn_static_kernel bug Co-authored-by: kkjocker<hexuanyu1@huawei.com> # message auto-generated for no-merge-commit merge: !34290 merge v2.7.1_26 into v2.7.1-26.0.0 fix use_aclnn_static_kernel bug Created-by: kkjocker Commit-by: kkjocker Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > “不涉及” # 【接口变更】 > “不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!342901 个月前
[DVM] Update decomposition excludes and generate list Co-authored-by: huangchengnuo<huangchengnuo1@huawei.com> # message auto-generated for no-merge-commit merge: !32068 merge fix_inductor_dvm_bug_v2.7.1 into v2.7.1 [DVM] Update decomposition excludes and generate list Created-by: SorryNaCN Commit-by: huangchengnuo Merged-by: ascend-robot Description: # 【合入来源】 - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [x] 重构优化 - [ ] 资料更新 # 【修改方案】 1. 更新 torch_npu/_inductor/dvm/decomp.py 中的 decomps_to_exclude_npu,将 DVM 与 NPU 侧需要排除 decomposition 的算子列表做并集整理,并按字面顺序排序,便于后续维护和差异比对。 2. 新增多类需要保留原始算子语义的排除项,包括 embeddingupsample_*nll_loss2d_*max_pool2d_with_indices*reflection_pad2d*grid_sampler_2d*triuslice.Tensor 等,避免这些算子在 DVM 路径上被提前 decomposition 后影响后续处理。 3. 更新 torch_npu/_inductor/dvm/mlir_fusion.py 中的 anir_config.GENERATE_LIST,增加 aten.unsqueeze,补充 DVM 融合生成阶段对该算子的支持范围。 # 【资料变更】 不涉及。 # 【接口变更】 不涉及。本次修改仅涉及 torch_npu/_inductor/dvm 内部算子处理配置和生成列表调整,不涉及跨仓接口和客户可见接口变更。 # 【功能验证】 1. 本地对修改文件执行语法校验: python -m py_compile torch_npu/_inductor/dvm/decomp.py torch_npu/_inductor/dvm/mlir_fusion.py 2. 已提交 MR 并触发流水线校验。 3. 当前未新增独立 UT 用例。本次修改主要为 DVM 内部配置项与算子列表调整,后续以流水线结果和相关场景回归为主。 # 【CheckList】 - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!320682 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
[inductor] fix(flex_attention): convert TensorBox to ComputedBuffer in subgraph output Co-authored-by: 魏展<weizhan4@huawei.com> # message auto-generated for no-merge-commit merge: !33752 merge flex_attention_npu_optim-v26_3 into v2.7.1-26.0.0 [inductor] fix(flex_attention): convert TensorBox to ComputedBuffer in subgraph output Created-by: weizhan4 Commit-by: 魏展 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337521 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
[inductor] exclude op in indirect_mem and lowering_override from FALLBACK_LIST Co-authored-by: jimmycao9929<caohaijun3@huawei.com> # message auto-generated for no-merge-commit merge: !30800 merge v2.7.1-0211 into v2.7.1 [inductor] exclude op in indirect_mem and lowering_override from FALLBACK_LIST Created-by: jimmycao9929 Commit-by: jimmycao9929 Merged-by: ascend-robot Description: # 【合入来源】 - [x] 重构优化 # 【修改方案】 1. 从FALLBACK_LIST中把 LOWERING_OVERLOAD_OP 和 INDIRECT_MEM_OVERLOAD_LIST中的op排除掉 2. 默认打开ENABLE_FALLBACK_LIST开关,A5上使用FALLBACK_LIST # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 已经在多个模型(mmoe/dlrm/onerec/mind)上验证通过 # 【CheckList】 - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!308003 个月前
[inductor] add patch run_node Co-authored-by: Stonexx<sheny1xuan@163.com> # message auto-generated for no-merge-commit merge: !33642 merge patch_runnode into v2.7.1-26.0.0 [inductor] add patch run_node Created-by: stonexxx Commit-by: Stonexx Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!336421 个月前
【inductor】Add Catlass backend Co-authored-by: shi-bibibi99<shiyufeng8@huawei.com> # message auto-generated for no-merge-commit merge: !28757 merge 1227_catlass_v2.7.1 into v2.7.1 【inductor】Add Catlass backend Created-by: shi-yufeng99 Commit-by: shi-bibibi99 Merged-by: ascend-robot Description: 【inductor】Add Catlass backend <!-- Thanks for sending a pull request! --> **What type of PR is this?** > /kind feature **What does this PR do / why do we need it**: Add catlass backend for torch.mm, torch.bmm, and torch.addmm when enable compiling in max_autotune mode. Its usage is basically equal to the cutlass backend for NVIDIA GPU. An example to enable catlass backend for torch.compile: ``` # git clone https://gitee.com/ascend/catlass.git /tmp/catlass import torch import torch_npu from torch._inductor import config from torch_npu._inductor import config as npu_config config.max_autotune = True config.max_autotune_gemm_backends = "CATLASS,ATen" npu_config.catlass.catlass_dir = /tmp/catlass npu_config.catlass.catlass_max_profiling_configs = 4 ``` **Which issue(s) this PR fixes**: <!-- *Automatically closes linked issue when PR is merged. Usage: Fixes #<issue number>, or Fixes (paste link of issue). --> Fixes # **Special notes for your reviewers**: See merge request: Ascend/pytorch!287574 个月前
【inductor】Add Catlass backend Co-authored-by: shi-bibibi99<shiyufeng8@huawei.com> # message auto-generated for no-merge-commit merge: !28757 merge 1227_catlass_v2.7.1 into v2.7.1 【inductor】Add Catlass backend Created-by: shi-yufeng99 Commit-by: shi-bibibi99 Merged-by: ascend-robot Description: 【inductor】Add Catlass backend <!-- Thanks for sending a pull request! --> **What type of PR is this?** > /kind feature **What does this PR do / why do we need it**: Add catlass backend for torch.mm, torch.bmm, and torch.addmm when enable compiling in max_autotune mode. Its usage is basically equal to the cutlass backend for NVIDIA GPU. An example to enable catlass backend for torch.compile: ``` # git clone https://gitee.com/ascend/catlass.git /tmp/catlass import torch import torch_npu from torch._inductor import config from torch_npu._inductor import config as npu_config config.max_autotune = True config.max_autotune_gemm_backends = "CATLASS,ATen" npu_config.catlass.catlass_dir = /tmp/catlass npu_config.catlass.catlass_max_profiling_configs = 4 ``` **Which issue(s) this PR fixes**: <!-- *Automatically closes linked issue when PR is merged. Usage: Fixes #<issue number>, or Fixes (paste link of issue). --> Fixes # **Special notes for your reviewers**: See merge request: Ascend/pytorch!287574 个月前
【inductor】catlass adapts dynamic shape Co-authored-by: shi-bibibi99<shiyufeng8@huawei.com> # message auto-generated for no-merge-commit merge: !30740 merge 0210_catlass_bugfix_branch into v2.7.1 【inductor】catlass adapts dynamic shape Created-by: shi-yufeng99 Commit-by: shi-bibibi99 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > (如有)请关联需求文档/issue链接 - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!307403 个月前
[inductor] fix: set max_cat_count_in_per_kernel to None Co-authored-by: Stonexx<sheny1xuan@163.com> # message auto-generated for no-merge-commit merge: !33774 merge cat_default2 into v2.7.1-26.0.0 [inductor] fix: set max_cat_count_in_per_kernel to None Created-by: stonexxx Commit-by: Stonexx Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337741 个月前
【inductor】fix cflags bug Co-authored-by: kkjocker<hexuanyu1@huawei.com> # message auto-generated for no-merge-commit merge: !33306 merge v2.7.1_26_fix into v2.7.1-26.0.0 【inductor】fix cflags bug Created-by: kkjocker Commit-by: kkjocker Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > “不涉及” # 【接口变更】 > “不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!333061 个月前
allow aten.embedding_dense_backward to decompose Co-authored-by: shi-bibibi99<shiyufeng8@huawei.com> # message auto-generated for no-merge-commit merge: !33557 merge 0413_v2.7.1-26.0.0_emb_dense_backward into v2.7.1-26.0.0 allow aten.embedding_dense_backward to decompose Created-by: shi-yufeng99 Commit-by: shi-bibibi99 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!335571 个月前
fixed: autotune fasta simt报错问题 Co-authored-by: zhishang-qi<1610015759@qq.com> # message auto-generated for no-merge-commit merge: !32116 merge v2.7.1 into v2.7.1 fixed: autotune fasta simt报错问题 Created-by: zhishang-qi Commit-by: zhishang-qi Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [x] 重构优化 - [ ] 资料更新 # 【修改方案】 autotune 开启fasta和simt无异常 # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 autotune 开启fasta和simt无异常 # 【CheckList】 - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!321162 个月前
[inductor] add patch run_node Co-authored-by: Stonexx<sheny1xuan@163.com> # message auto-generated for no-merge-commit merge: !33642 merge patch_runnode into v2.7.1-26.0.0 [inductor] add patch run_node Created-by: stonexxx Commit-by: Stonexx Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!336421 个月前
[inductor] fix: set max_cat_count_in_per_kernel to None Co-authored-by: Stonexx<sheny1xuan@163.com> # message auto-generated for no-merge-commit merge: !33774 merge cat_default2 into v2.7.1-26.0.0 [inductor] fix: set max_cat_count_in_per_kernel to None Created-by: stonexxx Commit-by: Stonexx Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337741 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
/lgtm Co-authored-by: jimmycao9929<caohaijun3@huawei.com> # message auto-generated for no-merge-commit merge: !32188 merge 0319 into v2.7.1 [inductor][refactor] 把FALLBACK_LIST拆解成为TORCH_NATIVE_FALLBACK_LIST和NPU_EXTRA_FALLBACK_LIST Created-by: jimmycao9929 Commit-by: jimmycao9929 Merged-by: ascend-robot Description: # 【合入来源】 - [x] 重构优化 # 【修改方案】 把FALLBACK_LIST拆解成为TORCH_NATIVE_FALLBACK_LIST和NPU_EXTRA_FALLBACK_LIST,便于我们集中精力消除NPU_EXTRA_FALLBACK_LIST中的op # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 验证了mmoe、dlrm、onerec模型,无问题 # 【CheckList】 - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!321882 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
persistent reduction在persistent的dims==1时,去除reshape和where的DSL优化 Co-authored-by: shi-bibibi99<shiyufeng8@huawei.com> # message auto-generated for no-merge-commit merge: !29105 merge 0106_v2.7.1_persistent_reduction into v2.7.1 persistent reduction在persistent的dims==1时,去除reshape和where的DSL优化 Created-by: shi-yufeng99 Commit-by: shi-bibibi99 Merged-by: ascend-robot Description: <!-- Thanks for sending a pull request! --> **What type of PR is this?** > Uncomment only one /kind <> line, hit enter to put that in a new line, and remove leading whitespaces from that line: > > /kind bug > /kind task > /kind feature **What does this PR do / why do we need it**: persistent reduction在persistent的dims==1时,去除reshape和where的DSL优化 See merge request: Ascend/pytorch!291054 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
mlir_enabling_method Co-authored-by: cuiduo<cuiduo1@huawei.com> # message auto-generated for no-merge-commit merge: !29559 merge v2.7.1 into v2.7.1 mlir_enabling_method Created-by: cuiduo Commit-by: cuiduo Merged-by: ascend-robot Description: <!-- Thanks for sending a pull request! --> **What type of PR is this?** > /kind task **What does this PR do / why do we need it**: The enabling method of MLIR has been changed, and a new enabling method has been added,currently, there are three usage methods in total. Example 1 of Usage : ``` torch._inductor.config.npu_backend == "mlir" torch.compile(op_calc)(x) ``` Example 2 of Usage : torch.compile(op_calc,options={"npu_backend":"mlir"})(x) Example 3 of Usage : ``` import os os.environ['TORCHINDUCTOR_NPU_BACKEND'] = 'mlir' torch.compile(op_calc)(x) ``` See merge request: Ascend/pytorch!295594 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
[inductor]fix dim0 bug Co-authored-by: rain-666<chenxiaoyu12@huawei.com> # message auto-generated for no-merge-commit merge: !34227 merge v2.7.1_dim0 into v2.7.1-26.0.0 [inductor]fix dim0 bug Created-by: rain-666 Commit-by: rain-666 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!342271 个月前
fastautotune算法回合主干 Co-authored-by: wild-mechanical-small-flat<514123661@qq.com> # message auto-generated for no-merge-commit merge: !29446 merge v2.7.1 into v2.7.1 fastautotune算法回合主干 Created-by: wild-mechanical-small-flat Commit-by: wild-mechanical-small-flat Merged-by: ascend-robot Description: <!-- Thanks for sending a pull request! --> **What type of PR is this?** > feature **What does this PR do / why do we need it**: 新增fastaautotune算法,用于vv算子的tile调优。 **Which issue(s) this PR fixes**: <!-- *Automatically closes linked issue when PR is merged. Usage: Fixes #<issue number>, or Fixes (paste link of issue). --> Fixes # **Special notes for your reviewers**: See merge request: Ascend/pytorch!294464 个月前
【inductor】Add Catlass backend Co-authored-by: shi-bibibi99<shiyufeng8@huawei.com> # message auto-generated for no-merge-commit merge: !28757 merge 1227_catlass_v2.7.1 into v2.7.1 【inductor】Add Catlass backend Created-by: shi-yufeng99 Commit-by: shi-bibibi99 Merged-by: ascend-robot Description: 【inductor】Add Catlass backend <!-- Thanks for sending a pull request! --> **What type of PR is this?** > /kind feature **What does this PR do / why do we need it**: Add catlass backend for torch.mm, torch.bmm, and torch.addmm when enable compiling in max_autotune mode. Its usage is basically equal to the cutlass backend for NVIDIA GPU. An example to enable catlass backend for torch.compile: ``` # git clone https://gitee.com/ascend/catlass.git /tmp/catlass import torch import torch_npu from torch._inductor import config from torch_npu._inductor import config as npu_config config.max_autotune = True config.max_autotune_gemm_backends = "CATLASS,ATen" npu_config.catlass.catlass_dir = /tmp/catlass npu_config.catlass.catlass_max_profiling_configs = 4 ``` **Which issue(s) this PR fixes**: <!-- *Automatically closes linked issue when PR is merged. Usage: Fixes #<issue number>, or Fixes (paste link of issue). --> Fixes # **Special notes for your reviewers**: See merge request: Ascend/pytorch!287574 个月前
[Inductor] add aoti support Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !32868 merge v2.7.1-26.0.0 into v2.7.1-26.0.0 [Inductor] add aoti support Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: # 【合入来源】 add aoti support - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [x] 重构优化 - [ ] 资料更新 # 【修改方案】 1. add ffts check, device guard, dynamic shape support for AOTInductor, make CppWrapperNpu extends CppWrapperGpu, make fallback when cpp_wrapper meets mm/bmm/gmm, add utils_npu.h, shim_npu.h shim_npu.cpp into csrc\inductor, now AOTI works for v2.7.1 in A2\A3\A5 2. refactor triton heuristic logic, now get_heuristic will return heuristic type like community('pointwise', 'reduction' etc) 3. add support for cpp_wrapper # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci passes # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!328681 个月前
[Inductor] coverage/add test for shape handle Co-authored-by: luqichao<luqichao1@huawei.com> # message auto-generated for no-merge-commit merge: !31536 merge test/shape_handle into v2.7.1 [Inductor] coverage/add test for shape handle Created-by: luqichao Commit-by: luqichao Merged-by: ascend-robot Description: 补充shape_handle UT, 行覆盖94% 分支覆盖92% ![image.png](https://raw.gitcode.com/user-images/assets/7404318/95f58e93-784c-4c98-bb62-4c01069994a8/image.png 'image.png') See merge request: Ascend/pytorch!315362 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前