文件最后提交记录最后更新时间
【Inductor】add aot inductor for v2.7.1 Co-authored-by: Zichun Ye<zichun.ye@huawei.com> # message auto-generated for no-merge-commit merge: merge aoti_v27 into v2.7.1 【Inductor】add aot inductor for v2.7.1 Created-by: zichun_ye Commit-by: Zichun Ye Merged-by: ascend-robot Description: <!-- Thanks for sending a pull request! --> **What type of PR is this?** > Uncomment only one /kind <> line, hit enter to put that in a new line, and remove leading whitespaces from that line: > > /kind bug > /kind task /kind feature **What does this PR do / why do we need it**: add aot inductor for v2.7.1 update logic to generate cpp wrapper for v2.7.1 add the whole cpp utils functions for aot inductor fix some bugs **Which issue(s) this PR fixes**: <!-- *Automatically closes linked issue when PR is merged. Usage: Fixes #<issue number>, or Fixes (paste link of issue). --> Fixes # **Special notes for your reviewers**: See merge request: Ascend/pytorch!248538 个月前
del 910_95 Co-authored-by: MrMC-<shiqunze@h-partners.com> # message auto-generated for no-merge-commit merge: !30831 merge 2.7.1del-91095 into v2.7.1 del 910_95 Created-by: MrMC- Commit-by: MrMC- Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > A5改名需求 - [x] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 删除910_95 # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!308312 个月前
[inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Co-authored-by: Stonexx<sheny1xuan@163.com> Co-authored-by: ascend-robot<zhongyuanke@huawei.com> # message auto-generated for no-merge-commit merge: !33549 merge syncbranch into v2.7.1-26.0.0 [inductor] sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f Created-by: stonexxx Commit-by: Stonexx;ascend-robot Merged-by: ascend-robot Description: 1. sync from v2.7.1, commit id 053355ffedb152a5509ee48777e9dfb62c44cf8f 2. cherry-pick strengthen autotune profiling tenacity See merge request: Ascend/pytorch!335491 个月前
!22607 【inductor】support 2.7.1 Merge pull request !22607 from 杜承昆/inductor-271-new 10 个月前
!22607 【inductor】support 2.7.1 Merge pull request !22607 from 杜承昆/inductor-271-new 10 个月前
[Inductor] fix cpp_wrapper align bug Co-authored-by: zhuceHW<zhuce@huawei.com> # message auto-generated for no-merge-commit merge: !33674 merge v2.7.1-26.0.0 into v2.7.1-26.0.0 [Inductor] fix cpp_wrapper align bug Created-by: zhucehw Commit-by: zhuceHW Merged-by: ascend-robot Description: # 【合入来源】 ZJ qianchuan model issue - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 1. change align bytes num of cpp attribute in cpp_wrapper # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 ci passes # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!336741 个月前
[inductor] Fix DecisionTransform codegen bug caused by unified-axis mechanism Co-authored-by: 魏展<weizhan4@huawei.com> # message auto-generated for no-merge-commit merge: !33711 merge decisiontransform-codegen-fix-v26 into v2.7.1-26.0.0 [inductor] Fix DecisionTransform codegen bug caused by unified-axis mechanism Created-by: weizhan4 Commit-by: 魏展 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337111 个月前
[inductor][精度工具]fix _patch__npu_concatkernel_create/_patch_reduction_create Co-authored-by: ACAES<liuyan7892@163.com> # message auto-generated for no-merge-commit merge: !31745 merge v2.7.1 into v2.7.1 [inductor][精度工具]fix _patch__npu_concatkernel_create/_patch_reduction_create Created-by: AACAES Commit-by: ACAES Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) bugfix # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 sam模型跑通 ![image.png](https://raw.gitcode.com/user-images/assets/7404318/a5b5df36-154e-4c70-bf9c-bd80a4ed07f6/image.png 'image.png') outputcode 一致 ![image.png](https://raw.gitcode.com/user-images/assets/7404318/af4baf81-312a-4526-ade8-e5610cd5eb93/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!317452 个月前
[inductor] Fix DecisionTransform codegen bug caused by unified-axis mechanism Co-authored-by: 魏展<weizhan4@huawei.com> # message auto-generated for no-merge-commit merge: !33711 merge decisiontransform-codegen-fix-v26 into v2.7.1-26.0.0 [inductor] Fix DecisionTransform codegen bug caused by unified-axis mechanism Created-by: weizhan4 Commit-by: 魏展 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337111 个月前
【inductor】Add Catlass backend Co-authored-by: shi-bibibi99<shiyufeng8@huawei.com> # message auto-generated for no-merge-commit merge: !28757 merge 1227_catlass_v2.7.1 into v2.7.1 【inductor】Add Catlass backend Created-by: shi-yufeng99 Commit-by: shi-bibibi99 Merged-by: ascend-robot Description: 【inductor】Add Catlass backend <!-- Thanks for sending a pull request! --> **What type of PR is this?** > /kind feature **What does this PR do / why do we need it**: Add catlass backend for torch.mm, torch.bmm, and torch.addmm when enable compiling in max_autotune mode. Its usage is basically equal to the cutlass backend for NVIDIA GPU. An example to enable catlass backend for torch.compile: ``` # git clone https://gitee.com/ascend/catlass.git /tmp/catlass import torch import torch_npu from torch._inductor import config from torch_npu._inductor import config as npu_config config.max_autotune = True config.max_autotune_gemm_backends = "CATLASS,ATen" npu_config.catlass.catlass_dir = /tmp/catlass npu_config.catlass.catlass_max_profiling_configs = 4 ``` **Which issue(s) this PR fixes**: <!-- *Automatically closes linked issue when PR is merged. Usage: Fixes #<issue number>, or Fixes (paste link of issue). --> Fixes # **Special notes for your reviewers**: See merge request: Ascend/pytorch!287574 个月前
fix the circular dependency issue & add ut Co-authored-by: liangsongwei<liangsongwei@huawei.com> # message auto-generated for no-merge-commit merge: !26159 merge v2.7.1 into v2.7.1 fix the circular dependency issue & add ut Created-by: liangsongwei Commit-by: liangsongwei Merged-by: ascend-robot Description: <!-- Thanks for sending a pull request! --> **What type of PR is this?** > Uncomment only one /kind <> line, hit enter to put that in a new line, and remove leading whitespaces from that line: > > /kind bug > /kind task > /kind feature **What does this PR do / why do we need it**: **Which issue(s) this PR fixes**: <!-- *Automatically closes linked issue when PR is merged. Usage: Fixes #<issue number>, or Fixes (paste link of issue). --> Fixes # **Special notes for your reviewers**: See merge request: Ascend/pytorch!261596 个月前
[inductor][acc_tool] fix traced_graph_hash, remove precision correction, add aclgraph interception validation Co-authored-by: AACAES<liuyan7892@163.com> # message auto-generated for no-merge-commit merge: !33654 merge v2.7.1-26.0.0 into v2.7.1-26.0.0 [inductor][acc_tool] fix traced_graph_hash, remove precision correction, add aclgraph interception validation Created-by: AACAES Commit-by: AACAES Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) 2.8.0 2.9.0 fix同步 1. traced_graph_hash 避免hash碰撞,添加kernel name 的校验参数src_code生成hash,删去traced_graph.print_readable 导致算子重复dump fx与triton对应失败 2. actual.copy_(expected) 精度校正时未同步反向信息,导致反向精度错误,去掉精度校正 3. 增加不支持 aclgraph 的拦截校验 # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 自验BERT_pytorch、soft_actor_critic、speech_transformer问题已解,output_code对齐 ![image.png](https://raw.gitcode.com/user-images/assets/7404318/57d8348b-b106-491e-a4e9-41fcc3c6b5cf/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!336541 个月前
[inductor] fix: 修复单轴reduction的reduction dim选择错误 Co-authored-by: 魏展<weizhan4@huawei.com> # message auto-generated for no-merge-commit merge: !33542 merge w00609825_sumfix_v26 into v2.7.1-26.0.0 [inductor] fix: 修复单轴reduction的reduction dim选择错误 Created-by: weizhan4 Commit-by: 魏展 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!335421 个月前
[inductor][fix] make sure that BLOCK_SIZE and SUB_BLOCK_SIZE are 32 byte alignment Co-authored-by: jimmycao9929<caohaijun3@huawei.com> # message auto-generated for no-merge-commit merge: !33468 merge v2.7.1-26.0.0-0409-32b-align into v2.7.1-26.0.0 [inductor][fix] make sure that BLOCK_SIZE and SUB_BLOCK_SIZE are 32 byte alignment Created-by: jimmycao9929 Commit-by: jimmycao9929 Merged-by: ascend-robot Description: # 【合入来源】 - [x] 重构优化 # 【修改方案】 确保生成的tiling config的block_size和sub_block_size满足32bytes对齐,否则NPU-IR在编译时可能会失败 # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 增加UT # 【CheckList】 - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!334681 个月前
[inductor]fix coredim0 for dynamicshape Co-authored-by: rain-666<chenxiaoyu12@huawei.com> # message auto-generated for no-merge-commit merge: !33700 merge v2.7.1-26.0.0 into v2.7.1-26.0.0 [inductor]fix coredim0 for dynamicshape Created-by: rain-666 Commit-by: rain-666 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [ ] 代码注释完备,正确记录错误日志 - [ ] 代码实现进行了返回值、空指针等校验 - [ ] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!337001 个月前
离散访存代码整改 Co-authored-by: shenyixuan1<sheny1xuan@163.com> # message auto-generated for no-merge-commit merge: !29599 merge tiling_fix into v2.7.1 离散访存代码整改 Created-by: shenyixuan1 Commit-by: shenyixuan1 Merged-by: ascend-robot Description: 1. 删除冗余环境变量,离散访存保留1个环境变量INDUCTOR_INDIRECT_MEMORY_MODE:可选范围为(simd_simt_mix)、simt_template、simt_only、simd_simt_mix 2. 新增对simd_simt_mix模式下tiling的选择,支持相同dsl情况下模板、纯simt、simd的autotune See merge request: Ascend/pytorch!295994 个月前
fix use_aclnn_static_kernel bug Co-authored-by: kkjocker<hexuanyu1@huawei.com> # message auto-generated for no-merge-commit merge: !34290 merge v2.7.1_26 into v2.7.1-26.0.0 fix use_aclnn_static_kernel bug Created-by: kkjocker Commit-by: kkjocker Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 > <font color="red">**如有社区issue,请关联issue链接**</font>\ > <font color="red">**请勿携带内部流程信息(需求链接、问题单、内部issue等)**</font> - [ ] 需求 - [x] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容) # 【资料变更】 > “不涉及” # 【接口变更】 > “不涉及” # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [x] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!342901 个月前