op-plugin/test/core_tests · Ascend/op-plugin - AtomGit

ascend-robotfix: grouped matmul swiglu quant v2 mxfp4 shape infer

文件	最后提交记录	最后更新时间
test_atb_fake_tensor.py	[Fix] Enable trailing whitespace check, Fix trailing-whitespace errors detected by pre-commit Co-authored-by: zhoupeng<zp2165064878@163.com> # message auto-generated for no-merge-commit merge: !5043 merge op_code_check into master [Fix] Enable trailing whitespace check, Fix trailing-whitespace errors detected by pre-commit Created-by: thickhair Commit-by: zhoupeng Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [ ] 问题单 - [x] issue/工单 https://gitcode.com/Ascend/op-plugin/issues/129 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 修改pre-commit-config.yaml，开启trailing-whitespace检查，使用pre-commit进行检查和修复 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” # 【功能验证】 ![image.png](https://raw.gitcode.com/user-images/assets/7403085/549c5212-645f-4d66-82e2-88926bc8515e/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!5043	1 天前
test_compatibility.py	Fix test_compatibility Co-authored-by: dilililiwhy<why.wuhuanyu@huawei.com> # message auto-generated for no-merge-commit merge: merge fix_test_compatibility into master Fix test_compatibility Created-by: dilililiwhy Commit-by: dilililiwhy Merged-by: ascend-robot Description: <!-- Thanks for sending a pull request! --> What type of PR is this? > Uncomment only one `/kind <>` line, hit enter to put that in a new line, and remove leading whitespaces from that line: > > /kind bug > /kind task > /kind feature What does this PR do / why do we need it: Special notes for your reviewers: See merge request: Ascend/op-plugin !3317	7 个月前
test_fake_tensor.py	fix: grouped matmul swiglu quant v2 mxfp4 shape infer Co-authored-by: wang_ziqi<wangziqi4@huawei.com> # message auto-generated for no-merge-commit merge: !5049 merge gmm_bugfix into master fix: grouped matmul swiglu quant v2 mxfp4 shape infer Created-by: wang-ziqi-code Commit-by: wang_ziqi Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [ ] 需求 - [x] 问题单 https://atomgit.com/Ascend/op-plugin/issues/84 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】修复 `npu_grouped_matmul_swiglu_quant_v2` 在 Ascend950 MXFP4 / packed FP4 场景下的 output shape 推导问题。 1. 对齐 CANN infer shape 逻辑，MX 场景下 `weightScale` 为 `[E, ceil(K/64), N, 2]`，逻辑 N 应取 `weightScale.dim2`，不能按转置 view 或 FP4 uint8 物理存储再做额外补偿。 2. `npu_grouped_matmul_swiglu_quant_v2_meta` 中移除旧的 `FP4_IN_INT8` output/outputScale shape 补偿逻辑，统一按 CANN 输出： - `output = [M, N / 2]` - `outputScale = [M, ceil((N / 2) / 64), 2]` 3. `GroupedMatmulSwigluQuantV2NpuOpapi.cpp` 中保留 5D NZ 和 950 逻辑 3D weight 的路径区分： - 5D NZ 场景从 `weightScale` 推导逻辑 N。 - Ascend950 逻辑 3D weight 场景继续从 `weight.size(2)` 推导 N。 4. 新增 fake tensor 和 Ascend950 shape-only 用例，覆盖 MXFP4 input + FP8/FP4 output 的 shape 推导，避免 CPU golden 当前不支持 packed float4 MX 输入的问题影响回归看护。 # 【资料变更】不涉及。 # 【接口变更】不涉及 public API / YAML / schema 变更。 # 【功能验证】新增/调整用例： 1. `test/core_tests/test_fake_tensor.py` - 新增 Ascend950 MXFP4 fake tensor shape 回归，覆盖 FP8 output 和 FP4 output。 - 校验 output/outputScale shape 与 CANN infer shape 一致。 2. `test/test_custom_ops/test_npu_grouped_matmul_swiglu_quant_v2.py` - 新增 Ascend950 MXFP4 shape-only 后端用例。 - 覆盖 `x_dtype/weight_dtype=torch_npu.float4_e2m1fn_x2`，`weight_scale_dtype/x_scale_dtype=torch_npu.float8_e8m0fnu`。 - 校验 output/outputScale shape 和 dtype，不做数值 golden。 - 910B ![image.png](https://raw.gitcode.com/user-images/assets/7403085/cfb0a01e-4b2b-47f2-9bdb-048dc1eb9ef0/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/7403085/c87d6fdd-3d29-4bad-9320-34d04f6a4a3d/image.png 'image.png') - 950 ![image.png](https://raw.gitcode.com/user-images/assets/7403085/56b63bf8-9018-4379-b8a0-057a915101ba/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/7403085/b058a623-25a4-4020-be9f-b21e50ad107c/image.png 'image.png') # 【CheckList】 - [x] 代码注释完整，关键 shape 推导原因已说明 - [x] 参数合法性沿用现有校验逻辑 - [x] PR 标题建议使用 `fix: grouped matmul swiglu quant v2 mxfp4 shape infer` - [ ] CI 执行通过 ``` See merge request: Ascend/op-plugin!5049	4 小时前
torch_npu_OpApi_schema_all.json	[feat]新增swiglu_backward_mx_quant_with_dual_axis接口 Co-authored-by: ZhangW<zhangwei1176@huawei.com> # message auto-generated for no-merge-commit merge: !4927 merge swiglu_backward into master [feat]新增swiglu_backward_mx_quant_with_dual_axis接口 Created-by: ZhangWei1176 Commit-by: ZhangW Merged-by: ascend-robot Description: <!-- PR描述模板更新日期：20260203 --> # 【合入来源】 > <font color="red">如有社区issue，请关联issue链接</font>\ > <font color="red">请勿携带内部流程信息（需求链接、问题单、内部issue等）</font> - [x] 需求https://gitcode.com/Ascend/op-plugin/issues/128 - [ ] 问题单 - [ ] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 > 请描述修改内容的具体实现，涉及哪些组件之间进行交互，可以用1、2、3、...进行罗列\ > 如果是需求或者重构类的PR，需要补充详细设计文档（说明上下游组件关系、时序图、类图、DFX能力等内容）本次PR新增了一个名为 _npu_swiglu_backward_mx_quant_with_dual_axis 的自定义算子。该算子支持在双轴（dual axis）模式下进行混合精度量化，旨在为深度学习模型推理提供更灵活、高效的量化选项，以优化计算性能和内存使用。首先，在YAML配置文件中注册了该算子的接口定义。其次，在C++层实现了算子的核心API，包括输入校验、输出张量形状计算、内存分配，并最终调用底层硬件加速内核执行计算。同时，在JSON配置文件中更新了算子API模式测试的schema。最后，新增了对应的Python单元测试，用于验证算子在特定数据类型（如float8_e4m3fn）的功能正确性。整个方案覆盖了算子生命周期的配置、实现与验证环节。 # 【资料变更】 > 请确认是否涉及资料变更。如涉及，需要在PR中体现，并简要说明修改内容。如不涉及，需填写“不涉及” 不涉及 # 【接口变更】 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及，需要详细说明接口以及对应的变更内容，同时需要在资料中体现。如不涉及，需填写“不涉及” 不涉及 # 【功能验证】 > 说明测试场景，测试方法。如果本次测试方式与常规单元测试不同，请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护，并补充测试自验证截图 ut通过截图： ![image.png](https://raw.gitcode.com/user-images/assets/7403085/a8eefc7f-3e4f-487f-92da-5318bd7b9571/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] - [x] 代码注释完备，正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签，如：feat、fix、refactor、docs、test等 - [x] PR持续集成流水线（CI）执行通过，代码检查无异常 See merge request: Ascend/op-plugin!4927	18 小时前