| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !750 merge feat_gemm_test into master feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Created-by: nunnons2 Commit-by: majiajian_hw;yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/273 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> 接入torch_catlass接口方便测试。 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 15:  16:  17:  18:  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> NA ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!750 | 19 小时前 | |
optest新增部分样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !654 merge optest_long into master optest新增部分样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 新增29、30、32、41、45样例的torch接口至optest ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:接口补齐 See merge request: cann/catlass!654 | 24 天前 | |
补充23,43 torch_catlass接口 Co-authored-by: CheaterAbec<niyuhao2@huawei.com> # message auto-generated for no-merge-commit merge: !652 merge FA into master 补充23,43 torch_catlass接口 Created-by: CheaterAbec Commit-by: CheaterAbec Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增23_flash_attention_infer以及43_ascend950_basic_matmul接口和相关测试 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!652 | 24 天前 | |
integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Co-authored-by: CheaterAbec<niyuhao2@huawei.com> Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !703 merge master into master integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Created-by: CheaterAbec Commit-by: CheaterAbec;longjihui Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> cmd pytest tests/test_46_ascend950_matmul_fixpipe_opti.py tests/test_50_ascend950_basic_matmul_gemv.py tests/test_51_ascend950_quant_matmul_per_group_per_block_tla.py tests/test_57_ascend950_matmul_full_dequant.py -v ===================================================================================================================== test session starts ===================================================================================================================== =============================================================================================================== 440 passed in 243.45s (0:04:03) =============================================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!703 | 12 天前 | |
add Ascend950_batched_matmul/grouped_matmul_slice_m_fixpipe_dequant; add 59, 61, 67, 70 for torch_catlass Co-authored-by: CheaterAbec<niyuhao2@huawei.com> Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !706 merge master into master add Ascend950_batched_matmul/grouped_matmul_slice_m_fixpipe_dequant; add 59, 61, 67, 70 for torch_catlass Created-by: CheaterAbec Commit-by: CheaterAbec;init__zhb__ Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增ascend950代际的batched_matmul和grouped_matmul_slice_m_fixpipe_dequant算子样例 新增torch_catlass 59,61算子样例接口 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!706 | 11 天前 | |
chunkprefill_mask_pa Co-authored-by: lccchh<linchenghao@huawei.com> # message auto-generated for no-merge-commit merge: !700 merge 950_ChunkPrefill into master chunkprefill_mask_pa Created-by: lccchh Commit-by: lccchh Merged-by: cann-robot Description: ## 描述 新增适配Ascend950硬件的,不同于库上存量模板,使用[2048, 2048]压缩mask的flash attention,并支持以下特性:  ## 关联的Issue https://gitcode.com/cann/catlass/issues/234 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!700 | 5 天前 | |
49_ascend950_flash_attention_infer torch_catlass框架接口补齐 Co-authored-by: CheaterAbec<niyuhao2@huawei.com> # message auto-generated for no-merge-commit merge: !684 merge master into master 49_ascend950_flash_attention_infer torch_catlass框架接口补齐 Created-by: CheaterAbec Commit-by: CheaterAbec Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 49_ascend950_flash_attention_infer torch_catlass框架接口补齐 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> cmd ======================================================================================================================= test session starts ======================================================================================================================= platform linux -- Python 3.11.15, pytest-9.0.3, pluggy-1.6.0 -- /home/miniconda3/envs/niyuhao/bin/python3 cachedir: .pytest_cache rootdir: /home/n00955621/catlass_630/catlass_950/tests/optest configfile: pyproject.toml collected 20 items tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_b2_fp16] [W609 12:41:41.579147854 TensorFactories.cpp:340] Warning: Cannot create tensor with interal format while allow_internel_format=False, tensor will be created with base format. (function operator()) PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_nomask_b2_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_gqa_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_readme_shape] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_decode_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_head64_fp16] [W609 12:41:41.191383901 ToKernelNpu.cpp:41] Warning: Device do not support double dtype now, dtype cast replace with float. (function operator()) XFAIL (native example 49 fails head_dim=64 (Compare failed); kernel template targets embed=128) tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_b2_bf16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_b1_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_b4_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_nomask_b1_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_sq128_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_long_kv_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_small_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_gqa8x4_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_mha_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_nomask_gqa_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_decode_bf16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_nomask_decode_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_masked_b2_decode_fp16] PASSED tests/test_49_ascend950_flash_attention_infer.py::test_ascend950_flash_attention_infer[paged_nomask_readme_bf16] PASSED ================================================================================================================== 19 passed, 1 xfailed in 9.63s ================================================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!684 | 15 天前 | |
新增ascend950_fa适配mxfp8样例 Co-authored-by: sunhao_hw<sunhao203@huawei.com> # message auto-generated for no-merge-commit merge: !629 merge mxfp8 into master 新增ascend950_fa适配mxfp8样例 Created-by: sunhao_hw Commit-by: sunhao_hw Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> - 基于49_ascend950_flash_attention_infer样例,适配Q/K/V的mxfp8输入,同时需要输入Q/K/V对应缩放系数。 - 支持传入pScale对P做静态量化 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 使用optest自验600例精度通过: 脚本pytest设置: class TestAscend950MxFp8FlashAttentionInfer: @pytest.mark.parametrize("batch", [1, 2, 8]) @pytest.mark.parametrize("mask_type", [0, 1]) @pytest.mark.parametrize("use_p_scale", [False, True]) @pytest.mark.parametrize("q_seqlen", [128, 256, 1024, 2048, 3584]) @pytest.mark.parametrize("kv_seqlen", [128, 256, 1024, 2048, 3584]) @pytest.mark.parametrize("num_heads", [1, 2]) def test_mxfp8_flash_attention_infer_paged(self, batch, mask_type, use_p_scale, q_seqlen, kv_seqlen, num_heads): ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!629 | 9 天前 | |
add ascend950_fp8_mx_grouped_matmul_finalize_routing example Co-authored-by: cuijie25<cuijie24@h-partners.com> # message auto-generated for no-merge-commit merge: !716 merge gmm_finalize_push into master add ascend950_fp8_mx_grouped_matmul_finalize_routing example Created-by: cuijie25 Commit-by: cuijie25 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> add ascend950_fp8_mx_grouped_matmul_finalize_routing example ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 1.单算子验证PASS  2.接入 torch-catlass验证  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!716 | 10 天前 | |
增加 ascend950_fp8_groupedmatmul_swiglu_mx_quant Co-authored-by: wanshilin<wanshilin@h-partners.com> # message auto-generated for no-merge-commit merge: !709 merge master into master 增加 ascend950_fp8_groupedmatmul_swiglu_mx_quant Created-by: wanshilin Commit-by: wanshilin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 增加 fp8_groupedmatmul_swiglu_mx_quant的样例调用和适配torch_catlass的接口 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/260 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 随机用例通过 200/200  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!709 | 10 天前 | |
feat 补充Ascend950 GroupedMatmul类样例测试接口接入 Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !699 merge gmm.ascend950.optestin into master feat 补充Ascend950 GroupedMatmul类样例测试接口接入 Created-by: init__zhb__ Commit-by: init__zhb__ Merged-by: cann-robot Description: ## 描述 将 4 个 Ascend950 Grouped Matmul 样例(examples 47、48、55、60)接入 tests/optest 测试框架,完成从 kernel JIT 编译、torch C++ adapter 注册、Python wrapper 到 pytest 的完整链路。 移除70号样例,与此前48样例(grouped_matmul_fixpipe_dequant (per_tensor/per_channel))重复 --- Changes - ABI 声明:在 catlass_kernel_jit.h 新增 Ascend950MxGroupedMatmulSliceM(example 55)的 JIT 接口声明 - Kernel 接入(4 个新目录): - 47_ascend950_grouped_matmul_slice_m_per_token_dequant — int8 GMM + per-token dequant (MIX) - 48_ascend950_grouped_matmul_slice_m_per_tensor_per_channel_dequant — int8 GMM + fixpipe per-tensor/per-channel dequant (AIC) - 55_ascend950_mx_grouped_matmul_slice_m — MX grouped matmul slice-M (AIC) - 60_ascend950_grouped_matmul_slice_m — Grouped matmul slice-M TLA (AIC) - Torch Adapter: - 新增 grouped_fixpipe_dequant_matmul.h(example 48 专用 adapter,支持 scalar scalePerTensor + quantMode) - 新增 mx_grouped_matmul.h(example 55 专用 adapter,支持 MX scale + grouped) - catlass_torch.cpp 注册 4 个新 op 至 torch.ops.catlass.* - Python Wrapper:新增 4 个 Python 接口文件,更新 __init__.py 导出 - Pytest:新增 4 个测试文件,验证 shape/dtype/精度 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 ### 编译情况 Built successfully. bash ... Successfully built torch-catlass ============================================ Build completed successfully! ============================================ Wheel package in: /home/pacr_zhb/WKS/catlass_clean/tests/optest/dist/ ### 验证情况 bash $ pytest tests/ -k "47 or 48 or 55 or 60" ========================================================================================== test session starts ========================================================================================== platform linux -- Python 3.11.13, pytest-9.0.2, pluggy-1.6.0 rootdir: /home/z00951271/TEST/CI/catlass.CI699/tests/optest configfile: pyproject.toml plugins: anyio-4.12.1 collected 82 items / 76 deselected / 6 selected tests/test_47_ascend950_grouped_matmul_slice_m_per_token_dequant.py . [ 16%] tests/test_48_ascend950_grouped_matmul_slice_m_per_tensor_per_channel_dequant.py .. [ 50%] tests/test_55_ascend950_mx_grouped_matmul_slice_m.py .. [ 83%] tests/test_60_ascend950_grouped_matmul_slice_m.py . [100%] =================================================================================== 6 passed, 76 deselected in 27.12s ==================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!699 | 9 天前 | |
feat 补充Ascend950 GroupedMatmul类样例测试接口接入 Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !699 merge gmm.ascend950.optestin into master feat 补充Ascend950 GroupedMatmul类样例测试接口接入 Created-by: init__zhb__ Commit-by: init__zhb__ Merged-by: cann-robot Description: ## 描述 将 4 个 Ascend950 Grouped Matmul 样例(examples 47、48、55、60)接入 tests/optest 测试框架,完成从 kernel JIT 编译、torch C++ adapter 注册、Python wrapper 到 pytest 的完整链路。 移除70号样例,与此前48样例(grouped_matmul_fixpipe_dequant (per_tensor/per_channel))重复 --- Changes - ABI 声明:在 catlass_kernel_jit.h 新增 Ascend950MxGroupedMatmulSliceM(example 55)的 JIT 接口声明 - Kernel 接入(4 个新目录): - 47_ascend950_grouped_matmul_slice_m_per_token_dequant — int8 GMM + per-token dequant (MIX) - 48_ascend950_grouped_matmul_slice_m_per_tensor_per_channel_dequant — int8 GMM + fixpipe per-tensor/per-channel dequant (AIC) - 55_ascend950_mx_grouped_matmul_slice_m — MX grouped matmul slice-M (AIC) - 60_ascend950_grouped_matmul_slice_m — Grouped matmul slice-M TLA (AIC) - Torch Adapter: - 新增 grouped_fixpipe_dequant_matmul.h(example 48 专用 adapter,支持 scalar scalePerTensor + quantMode) - 新增 mx_grouped_matmul.h(example 55 专用 adapter,支持 MX scale + grouped) - catlass_torch.cpp 注册 4 个新 op 至 torch.ops.catlass.* - Python Wrapper:新增 4 个 Python 接口文件,更新 __init__.py 导出 - Pytest:新增 4 个测试文件,验证 shape/dtype/精度 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 ### 编译情况 Built successfully. bash ... Successfully built torch-catlass ============================================ Build completed successfully! ============================================ Wheel package in: /home/pacr_zhb/WKS/catlass_clean/tests/optest/dist/ ### 验证情况 bash $ pytest tests/ -k "47 or 48 or 55 or 60" ========================================================================================== test session starts ========================================================================================== platform linux -- Python 3.11.13, pytest-9.0.2, pluggy-1.6.0 rootdir: /home/z00951271/TEST/CI/catlass.CI699/tests/optest configfile: pyproject.toml plugins: anyio-4.12.1 collected 82 items / 76 deselected / 6 selected tests/test_47_ascend950_grouped_matmul_slice_m_per_token_dequant.py . [ 16%] tests/test_48_ascend950_grouped_matmul_slice_m_per_tensor_per_channel_dequant.py .. [ 50%] tests/test_55_ascend950_mx_grouped_matmul_slice_m.py .. [ 83%] tests/test_60_ascend950_grouped_matmul_slice_m.py . [100%] =================================================================================== 6 passed, 76 deselected in 27.12s ==================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!699 | 9 天前 | |
feat 补充Ascend950 GroupedMatmul类样例测试接口接入 Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !699 merge gmm.ascend950.optestin into master feat 补充Ascend950 GroupedMatmul类样例测试接口接入 Created-by: init__zhb__ Commit-by: init__zhb__ Merged-by: cann-robot Description: ## 描述 将 4 个 Ascend950 Grouped Matmul 样例(examples 47、48、55、60)接入 tests/optest 测试框架,完成从 kernel JIT 编译、torch C++ adapter 注册、Python wrapper 到 pytest 的完整链路。 移除70号样例,与此前48样例(grouped_matmul_fixpipe_dequant (per_tensor/per_channel))重复 --- Changes - ABI 声明:在 catlass_kernel_jit.h 新增 Ascend950MxGroupedMatmulSliceM(example 55)的 JIT 接口声明 - Kernel 接入(4 个新目录): - 47_ascend950_grouped_matmul_slice_m_per_token_dequant — int8 GMM + per-token dequant (MIX) - 48_ascend950_grouped_matmul_slice_m_per_tensor_per_channel_dequant — int8 GMM + fixpipe per-tensor/per-channel dequant (AIC) - 55_ascend950_mx_grouped_matmul_slice_m — MX grouped matmul slice-M (AIC) - 60_ascend950_grouped_matmul_slice_m — Grouped matmul slice-M TLA (AIC) - Torch Adapter: - 新增 grouped_fixpipe_dequant_matmul.h(example 48 专用 adapter,支持 scalar scalePerTensor + quantMode) - 新增 mx_grouped_matmul.h(example 55 专用 adapter,支持 MX scale + grouped) - catlass_torch.cpp 注册 4 个新 op 至 torch.ops.catlass.* - Python Wrapper:新增 4 个 Python 接口文件,更新 __init__.py 导出 - Pytest:新增 4 个测试文件,验证 shape/dtype/精度 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 ### 编译情况 Built successfully. bash ... Successfully built torch-catlass ============================================ Build completed successfully! ============================================ Wheel package in: /home/pacr_zhb/WKS/catlass_clean/tests/optest/dist/ ### 验证情况 bash $ pytest tests/ -k "47 or 48 or 55 or 60" ========================================================================================== test session starts ========================================================================================== platform linux -- Python 3.11.13, pytest-9.0.2, pluggy-1.6.0 rootdir: /home/z00951271/TEST/CI/catlass.CI699/tests/optest configfile: pyproject.toml plugins: anyio-4.12.1 collected 82 items / 76 deselected / 6 selected tests/test_47_ascend950_grouped_matmul_slice_m_per_token_dequant.py . [ 16%] tests/test_48_ascend950_grouped_matmul_slice_m_per_tensor_per_channel_dequant.py .. [ 50%] tests/test_55_ascend950_mx_grouped_matmul_slice_m.py .. [ 83%] tests/test_60_ascend950_grouped_matmul_slice_m.py . [100%] =================================================================================== 6 passed, 76 deselected in 27.12s ==================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!699 | 9 天前 | |
add a declarative post-processing framework, EVG. Co-authored-by: li_wei21<liwei949@huawei.com> Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !679 merge catlass_evg_0608 into master add a declarative post-processing framework, EVG. Created-by: li_wei21 Commit-by: li_wei21;yuantao Merged-by: cann-robot Description: ## 描述 Catlass开源仓新增特性EVG,增强后处理代码的易用性,同时补充对应的测试样例。 EVG设计的详细说明可以参考issue。 ## 关联的Issue https://gitcode.com/cann/catlass/issues/233 ## 测试 已对每一个EVG类型的模板样例分别进行200个case测试,结果通过 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!679 | 18 天前 | |
integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Co-authored-by: CheaterAbec<niyuhao2@huawei.com> Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !703 merge master into master integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Created-by: CheaterAbec Commit-by: CheaterAbec;longjihui Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> cmd pytest tests/test_46_ascend950_matmul_fixpipe_opti.py tests/test_50_ascend950_basic_matmul_gemv.py tests/test_51_ascend950_quant_matmul_per_group_per_block_tla.py tests/test_57_ascend950_matmul_full_dequant.py -v ===================================================================================================================== test session starts ===================================================================================================================== =============================================================================================================== 440 passed in 243.45s (0:04:03) =============================================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!703 | 12 天前 | |
integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Co-authored-by: CheaterAbec<niyuhao2@huawei.com> Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !703 merge master into master integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Created-by: CheaterAbec Commit-by: CheaterAbec;longjihui Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> cmd pytest tests/test_46_ascend950_matmul_fixpipe_opti.py tests/test_50_ascend950_basic_matmul_gemv.py tests/test_51_ascend950_quant_matmul_per_group_per_block_tla.py tests/test_57_ascend950_matmul_full_dequant.py -v ===================================================================================================================== test session starts ===================================================================================================================== =============================================================================================================== 440 passed in 243.45s (0:04:03) =============================================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!703 | 12 天前 | |
迁移Ascend 950 Matmul FullLoadA实现 Co-authored-by: huangxin361<huangxin36@huawei.com> # message auto-generated for no-merge-commit merge: !686 merge master into master 迁移Ascend 950 Matmul FullLoadA实现 Created-by: huangxin361 Commit-by: huangxin361 Merged-by: cann-robot Description: ## 描述 增加Ascend950平台的FullLoad全载Matmul优化实现 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 精度泛化验证测试通过  RDV全量测试通过  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!686 | 9 天前 | |
修复完善55 grouped matmul (MX) 测试接口 Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> Co-authored-by: gitcode-bot<noreply@gitcode.com> # message auto-generated for no-merge-commit merge: !744 merge fix.55gmm into master 修复完善55 grouped matmul (MX) 测试接口 Created-by: init__zhb__ Commit-by: init__zhb__;gitcode-bot Merged-by: cann-robot Description: ## 描述 - [bugfix] 修改错误的 CanImplement逻辑 - [feat] 增补enable_aswt和enable_preload选项(JIT编译增设TParamsWithFlags结构体),保证可覆盖到优化组件。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 测试通过: plain $ pytest tests/test_55_mx_grouped_matmul_slice_m.py -sv ... PASSED tests/test_55_mx_grouped_matmul_slice_m.py::test_ascend950_mx_grouped_matmul_slice_m_fp4[aswt_preload-nt] [JIT][INFO] /catlass/tests/optest/kernels/jit/jit_compiler.cpp:130] compiling: ascend950_mx_grouped_matmul_slice_m → /root/.cache/catlass/jit_cache/v1.5.0+406ca7b9+20260624195424/a98b8a3daf9efa10099d5caa555761e8c83dd02d75769d51ba2be55663165bae.so [JIT][DEBUG] /catlass/tests/optest/kernels/jit/jit_compiler.cpp:171] compile: /usr/local/Ascend/cann-9.1.0-beta.1/tools/bisheng_compiler/bin/ccec -x asc -std=c++17 -O2 -shared --npu-arch=dav-3510 -DCATLASS_ARCH=3510 -DKERNEL_TYPE=__cube__ -DCATLASS_VERSION_FULL=v1.5.0+406ca7b9+20260624195424 -DCATLASS_JIT_ELEMENT_A=float4_e2m1x2_t -DCATLASS_JIT_ELEMENT_B=float4_e2m1x2_t -DCATLASS_JIT_ELEMENT_C=float -DCATLASS_JIT_ELEMENT_MX_SCALE=float8_e8m0_t -DCATLASS_JIT_KERNEL_NAME=ascend950_mx_grouped_matmul_slice_m_float4_e2m1x2_t_float4_e2m1x2_t_float_float8_e8m0_t_RowMajor_ColumnMajor_RowMajor -DCATLASS_JIT_LAYOUT_A=RowMajor -DCATLASS_JIT_LAYOUT_B=ColumnMajor -DCATLASS_JIT_LAYOUT_C=RowMajor -DCATLASS_KERNEL_NAME=ascend950_mx_grouped_matmul_slice_m -DL2_CACHE_HINT=1 -DMX_GMM_ENABLE_ASWT=1 -DMX_GMM_ENABLE_PRELOAD=1 -DKERNEL_NAME=ascend950_mx_grouped_matmul_slice_m_float4_e2m1x2_t_float4_e2m1x2_t_float_float8_e8m0_t_RowMajor_ColumnMajor_RowMajor -DCATLASS_JIT_KERNEL_NAME=ascend950_mx_grouped_matmul_slice_m_float4_e2m1x2_t_float4_e2m1x2_t_float_float8_e8m0_t_RowMajor_ColumnMajor_RowMajor_arch3510 -I/usr/local/python3.12.13/lib/python3.12/site-packages/torch_catlass/include -I/usr/local/python3.12.13/lib/python3.12/site-packages/torch_catlass/jit /usr/local/python3.12.13/lib/python3.12/site-packages/torch_catlass/jit/templates/mx_grouped_matmul_slice_m_impl.cpp -o /root/.cache/catlass/jit_cache/v1.5.0+406ca7b9+20260624195424/a98b8a3daf9efa10099d5caa555761e8c83dd02d75769d51ba2be55663165bae.so PASSED ======================== 12 passed in 67.22s (0:01:07) ========================= ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!744 | 1 天前 | |
example 63 pybind输出补充校验 Co-authored-by: Chen_HaoWen<chenhaowen12@huawei.com> # message auto-generated for no-merge-commit merge: !726 merge master_pybind into master example 63 pybind输出补充校验 Created-by: Chen_HaoWen Commit-by: Chen_HaoWen Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!726 | 9 天前 | |
integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Co-authored-by: CheaterAbec<niyuhao2@huawei.com> Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !703 merge master into master integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass Created-by: CheaterAbec Commit-by: CheaterAbec;longjihui Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> integrate 4 Ascend950 examples (46,50,51,57) into torch_catlass ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> cmd pytest tests/test_46_ascend950_matmul_fixpipe_opti.py tests/test_50_ascend950_basic_matmul_gemv.py tests/test_51_ascend950_quant_matmul_per_group_per_block_tla.py tests/test_57_ascend950_matmul_full_dequant.py -v ===================================================================================================================== test session starts ===================================================================================================================== =============================================================================================================== 440 passed in 243.45s (0:04:03) =============================================================================================================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!703 | 12 天前 | |
[feat]补充66_ascend950_streamk_matmul样例 Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !678 merge dev.950streamK into master [feat]补充66_ascend950_streamk_matmul样例 Created-by: init__zhb__ Commit-by: init__zhb__ Merged-by: cann-robot Description: ## 描述 补充66_ascend950_streamk_matmul样例(其AtlasA2同型样例为[streamK](https://gitcode.com/cann/catlass/blob/master/examples/37_streamk_matmul/README.md)) ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 1. 单算子验证<span style="color:green">PASS</span>  [root@localhost catlass.dev_check]# grep -wc "Compare success" tmp/64_ascend950_streamk_matmul/log/64_ascend950_streamk_matmul_run_20260609145240.log 132 2. 接入torch-catlass 快速验证 bash # pytest tests/ -k "66" -sv 2>&1 | tee 66.log ============================= test session starts ============================== platform linux -- Python 3.11.13, pytest-9.0.2, pluggy-1.6.0 -- /root/python3.11.13/bin/python3.11 cachedir: .pytest_cache rootdir: /xxx/tests/optest ... Loading kernel libraries... collected 72 items / 70 deselected / 2 selected tests/test_66_ascend950_streamk_matmul.py::test_ascend950_streamk_matmul [W616 11:19:18.054335656 TensorFactories.cpp:340] Warning: Cannot create tensor with interal format while allow_internel_format=False, tensor will be created with base format. (function operator()) [JIT][INFO] /xxx/tests/optest/kernels/jit/jit_compiler.cpp:72] JIT init: cache=/root/.cache/catlass/jit_cache/v1.5.0+cc053ba+20260616004116 compiler=/usr/local/Ascend/cann-9.0.0/tools/bisheng_compiler/bin/ccec arch=3510 template=/root/python3.11.13/lib/python3.11/site-packages/torch_catlass/jit/templates/ [W616 11:19:18.085127885 ToKernelNpu.cpp:41] Warning: Device do not support double dtype now, dtype cast replace with float. (function operator()) PASSED PASSED ====================== 2 passed, 70 deselected in 43.02s ======================= ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!678 | 11 天前 | |
optest功能优化、文档补充 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !637 merge refactor/optest-jit-and-conventions into master optest功能优化、文档补充 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!637 | 30 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
新增 01 02 05 07 0910 11 12 22测试接口 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !659 merge optest into master 新增 01 02 05 07 0910 11 12 22测试接口 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 | # | 名称 | 分类 | 状态 | |---|------|------|------| | 01 | batched_matmul | 批量矩阵乘 | ✅ | | 02 | grouped_matmul_slice_m | 分组 Slice-M | ✅ | | 05 | grouped_matmul_slice_k | 分组 Slice-K | ✅ | | 07 | grouped_matmul_slice_m_per_token_dequant | 分组 + 量化 Slice-M | ✅ | | 09 | splitk_matmul | 多核 Split-K | ✅ | | 10 | grouped_matmul_slice_m_per_token_dequant_multistage | 分组 + 量化 + 多级 workspace | ✅ | | 11 | grouped_matmul_slice_k_per_token_dequant | 分组 + 量化 Slice-K | ✅ | | 12 | quant_matmul | 量化矩阵乘(多级 workspace) | ✅ | | 22 | padding_splitk_matmul | 对齐填充 + Split-K | ✅ | 新增适配器模板 | 模板 | 适用算子 | |------|---------| | BatchedMatmulLike<KernelFn> | 01(3-D 张量批量乘) | | GroupedMatmulLike<KernelFn, SliceDir> | 02/05(分组 slice-M/K) | | GroupedQuantMatmulLike<KernelFn, SliceDir> | 07/10/11(分组量化 scale+per_token_scale) | | 复用现有 MatmulLike / QuantMatmulLike | 09/12/22 | ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!659 | 19 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
新增 broadcast_matmul_perblock_quant torch封装及测试 Co-authored-by: gt0cd001<ranzherui@huawei.com> # message auto-generated for no-merge-commit merge: !623 merge test_broadcast_matmul_perblock_quant into master 新增 broadcast_matmul_perblock_quant torch封装及测试 Created-by: gt0cd001 Commit-by: gt0cd001 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增 broadcast_matmul_perblock_quant torch封装,添加 broadcast_matmul_perblock_quant 测试。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> python test_example.py python test_62_ascend950_broadcast_matmul_perblock_quant.py ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!623 | 16 天前 | |
补充23,43 torch_catlass接口 Co-authored-by: CheaterAbec<niyuhao2@huawei.com> # message auto-generated for no-merge-commit merge: !652 merge FA into master 补充23,43 torch_catlass接口 Created-by: CheaterAbec Commit-by: CheaterAbec Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增23_flash_attention_infer以及43_ascend950_basic_matmul接口和相关测试 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!652 | 24 天前 | |
新增19_mla/40_flash_attention_infer_tla的torch_catlass接口 Co-authored-by: CheaterAbec<niyuhao2@huawei.com> # message auto-generated for no-merge-commit merge: !661 merge FA into master 新增19_mla/40_flash_attention_infer_tla的torch_catlass接口 Created-by: CheaterAbec Commit-by: CheaterAbec Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增19_mla/40_flash_attention_infer_tla的torch_catlass接口 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->   ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!661 | 18 天前 | |
feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !750 merge feat_gemm_test into master feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Created-by: nunnons2 Commit-by: majiajian_hw;yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/273 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> 接入torch_catlass接口方便测试。 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 15:  16:  17:  18:  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> NA ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!750 | 19 小时前 | |
feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !750 merge feat_gemm_test into master feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Created-by: nunnons2 Commit-by: majiajian_hw;yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/273 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> 接入torch_catlass接口方便测试。 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 15:  16:  17:  18:  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> NA ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!750 | 19 小时前 | |
feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !750 merge feat_gemm_test into master feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Created-by: nunnons2 Commit-by: majiajian_hw;yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/273 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> 接入torch_catlass接口方便测试。 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 15:  16:  17:  18:  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> NA ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!750 | 19 小时前 | |
feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !750 merge feat_gemm_test into master feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework Created-by: nunnons2 Commit-by: majiajian_hw;yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> feat: integrate examples 15-18 (gemm, group_gemm, gemv_aiv, gemv_aic) into optest framework ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/273 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> 接入torch_catlass接口方便测试。 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 15:  16:  17:  18:  ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> NA ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!750 | 19 小时前 | |
feat 补充08_grouped_matmul的测试接口接入 Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !689 merge optest.08gmm into master feat 补充08_grouped_matmul的测试接口接入 Created-by: init__zhb__ Commit-by: init__zhb__ Merged-by: cann-robot Description: ## 描述 测试接口接入( optest),针对样例:[08_grouped_matmul](https://gitcode.com/cann/catlass/blob/master/examples/08_grouped_matmul/README.md) ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 测试通过 ... plugins: xdist-3.8.0, cov-7.0.0, mock-3.15.1 collecting ... collected 54 items tests/test_00_basic_matmul.py::test_basic_matmul PASSED [ 1%] tests/test_01_batched_matmul.py::test_batched_matmul PASSED [ 3%] tests/test_02_grouped_matmul_slice_m.py::test_grouped_matmul_slice_m PASSED [ 5%] tests/test_03_matmul_add.py::test_matmul_add PASSED [ 7%] tests/test_04_padding_matmul.py::test_padding_matmul PASSED [ 9%] tests/test_05_grouped_matmul_slice_k.py::test_grouped_matmul_slice_k PASSED [ 11%] tests/test_06_optimized_matmul.py::test_optimized_matmul PASSED [ 12%] tests/test_07_grouped_matmul_slice_m_per_token_dequant_moe.py::test_grouped_matmul_slice_m_per_token_dequant_moe PASSED [ 14%] tests/test_08_grouped_matmul.py::test_grouped_matmul PASSED [ 16%] ... ================== 38 passed, 16 skipped in 355.61s (0:05:55) ================== ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!689 | 16 天前 | |
新增 01 02 05 07 0910 11 12 22测试接口 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !659 merge optest into master 新增 01 02 05 07 0910 11 12 22测试接口 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 | # | 名称 | 分类 | 状态 | |---|------|------|------| | 01 | batched_matmul | 批量矩阵乘 | ✅ | | 02 | grouped_matmul_slice_m | 分组 Slice-M | ✅ | | 05 | grouped_matmul_slice_k | 分组 Slice-K | ✅ | | 07 | grouped_matmul_slice_m_per_token_dequant | 分组 + 量化 Slice-M | ✅ | | 09 | splitk_matmul | 多核 Split-K | ✅ | | 10 | grouped_matmul_slice_m_per_token_dequant_multistage | 分组 + 量化 + 多级 workspace | ✅ | | 11 | grouped_matmul_slice_k_per_token_dequant | 分组 + 量化 Slice-K | ✅ | | 12 | quant_matmul | 量化矩阵乘(多级 workspace) | ✅ | | 22 | padding_splitk_matmul | 对齐填充 + Split-K | ✅ | 新增适配器模板 | 模板 | 适用算子 | |------|---------| | BatchedMatmulLike<KernelFn> | 01(3-D 张量批量乘) | | GroupedMatmulLike<KernelFn, SliceDir> | 02/05(分组 slice-M/K) | | GroupedQuantMatmulLike<KernelFn, SliceDir> | 07/10/11(分组量化 scale+per_token_scale) | | 复用现有 MatmulLike / QuantMatmulLike | 09/12/22 | ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!659 | 19 天前 | |
新增 01 02 05 07 0910 11 12 22测试接口 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !659 merge optest into master 新增 01 02 05 07 0910 11 12 22测试接口 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 | # | 名称 | 分类 | 状态 | |---|------|------|------| | 01 | batched_matmul | 批量矩阵乘 | ✅ | | 02 | grouped_matmul_slice_m | 分组 Slice-M | ✅ | | 05 | grouped_matmul_slice_k | 分组 Slice-K | ✅ | | 07 | grouped_matmul_slice_m_per_token_dequant | 分组 + 量化 Slice-M | ✅ | | 09 | splitk_matmul | 多核 Split-K | ✅ | | 10 | grouped_matmul_slice_m_per_token_dequant_multistage | 分组 + 量化 + 多级 workspace | ✅ | | 11 | grouped_matmul_slice_k_per_token_dequant | 分组 + 量化 Slice-K | ✅ | | 12 | quant_matmul | 量化矩阵乘(多级 workspace) | ✅ | | 22 | padding_splitk_matmul | 对齐填充 + Split-K | ✅ | 新增适配器模板 | 模板 | 适用算子 | |------|---------| | BatchedMatmulLike<KernelFn> | 01(3-D 张量批量乘) | | GroupedMatmulLike<KernelFn, SliceDir> | 02/05(分组 slice-M/K) | | GroupedQuantMatmulLike<KernelFn, SliceDir> | 07/10/11(分组量化 scale+per_token_scale) | | 复用现有 MatmulLike / QuantMatmulLike | 09/12/22 | ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!659 | 19 天前 | |
新增 01 02 05 07 0910 11 12 22测试接口 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !659 merge optest into master 新增 01 02 05 07 0910 11 12 22测试接口 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 | # | 名称 | 分类 | 状态 | |---|------|------|------| | 01 | batched_matmul | 批量矩阵乘 | ✅ | | 02 | grouped_matmul_slice_m | 分组 Slice-M | ✅ | | 05 | grouped_matmul_slice_k | 分组 Slice-K | ✅ | | 07 | grouped_matmul_slice_m_per_token_dequant | 分组 + 量化 Slice-M | ✅ | | 09 | splitk_matmul | 多核 Split-K | ✅ | | 10 | grouped_matmul_slice_m_per_token_dequant_multistage | 分组 + 量化 + 多级 workspace | ✅ | | 11 | grouped_matmul_slice_k_per_token_dequant | 分组 + 量化 Slice-K | ✅ | | 12 | quant_matmul | 量化矩阵乘(多级 workspace) | ✅ | | 22 | padding_splitk_matmul | 对齐填充 + Split-K | ✅ | 新增适配器模板 | 模板 | 适用算子 | |------|---------| | BatchedMatmulLike<KernelFn> | 01(3-D 张量批量乘) | | GroupedMatmulLike<KernelFn, SliceDir> | 02/05(分组 slice-M/K) | | GroupedQuantMatmulLike<KernelFn, SliceDir> | 07/10/11(分组量化 scale+per_token_scale) | | 复用现有 MatmulLike / QuantMatmulLike | 09/12/22 | ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!659 | 19 天前 | |
Add test for 03/20/26/27/28 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !655 merge feat/matmul-epilogue-ops into master Add test for 03/20/26/27/28 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!655 | 25 天前 | |
Add test for 03/20/26/27/28 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !655 merge feat/matmul-epilogue-ops into master Add test for 03/20/26/27/28 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!655 | 25 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
Add test for 03/20/26/27/28 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !655 merge feat/matmul-epilogue-ops into master Add test for 03/20/26/27/28 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!655 | 25 天前 | |
Add test for 03/20/26/27/28 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !655 merge feat/matmul-epilogue-ops into master Add test for 03/20/26/27/28 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!655 | 25 天前 | |
Add test for 03/20/26/27/28 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !655 merge feat/matmul-epilogue-ops into master Add test for 03/20/26/27/28 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!655 | 25 天前 | |
新增19_mla/40_flash_attention_infer_tla的torch_catlass接口 Co-authored-by: CheaterAbec<niyuhao2@huawei.com> # message auto-generated for no-merge-commit merge: !661 merge FA into master 新增19_mla/40_flash_attention_infer_tla的torch_catlass接口 Created-by: CheaterAbec Commit-by: CheaterAbec Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增19_mla/40_flash_attention_infer_tla的torch_catlass接口 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->   ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!661 | 18 天前 | |
新增 Ascend950 MultiCoreSplitkMatmul Co-authored-by: yjp-hw<yanjiapeng1@huawei.com> # message auto-generated for no-merge-commit merge: !704 merge 68_multisplitk into master 新增 Ascend950 MultiCoreSplitkMatmul Created-by: yjp-hw Commit-by: yjp-hw Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 针对特定负载不均衡的Ascend950 matmul场景,新增理论性能更优的切K matmul模板 针对基本块数小于AICORE数的场景,新增68_ascend950_multi_core_splitk_matmul ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/249 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!704 | 11 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
新增 01 02 05 07 0910 11 12 22测试接口 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !659 merge optest into master 新增 01 02 05 07 0910 11 12 22测试接口 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 | # | 名称 | 分类 | 状态 | |---|------|------|------| | 01 | batched_matmul | 批量矩阵乘 | ✅ | | 02 | grouped_matmul_slice_m | 分组 Slice-M | ✅ | | 05 | grouped_matmul_slice_k | 分组 Slice-K | ✅ | | 07 | grouped_matmul_slice_m_per_token_dequant | 分组 + 量化 Slice-M | ✅ | | 09 | splitk_matmul | 多核 Split-K | ✅ | | 10 | grouped_matmul_slice_m_per_token_dequant_multistage | 分组 + 量化 + 多级 workspace | ✅ | | 11 | grouped_matmul_slice_k_per_token_dequant | 分组 + 量化 Slice-K | ✅ | | 12 | quant_matmul | 量化矩阵乘(多级 workspace) | ✅ | | 22 | padding_splitk_matmul | 对齐填充 + Split-K | ✅ | 新增适配器模板 | 模板 | 适用算子 | |------|---------| | BatchedMatmulLike<KernelFn> | 01(3-D 张量批量乘) | | GroupedMatmulLike<KernelFn, SliceDir> | 02/05(分组 slice-M/K) | | GroupedQuantMatmulLike<KernelFn, SliceDir> | 07/10/11(分组量化 scale+per_token_scale) | | 复用现有 MatmulLike / QuantMatmulLike | 09/12/22 | ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!659 | 19 天前 | |
新增 01 02 05 07 0910 11 12 22测试接口 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !659 merge optest into master 新增 01 02 05 07 0910 11 12 22测试接口 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 | # | 名称 | 分类 | 状态 | |---|------|------|------| | 01 | batched_matmul | 批量矩阵乘 | ✅ | | 02 | grouped_matmul_slice_m | 分组 Slice-M | ✅ | | 05 | grouped_matmul_slice_k | 分组 Slice-K | ✅ | | 07 | grouped_matmul_slice_m_per_token_dequant | 分组 + 量化 Slice-M | ✅ | | 09 | splitk_matmul | 多核 Split-K | ✅ | | 10 | grouped_matmul_slice_m_per_token_dequant_multistage | 分组 + 量化 + 多级 workspace | ✅ | | 11 | grouped_matmul_slice_k_per_token_dequant | 分组 + 量化 Slice-K | ✅ | | 12 | quant_matmul | 量化矩阵乘(多级 workspace) | ✅ | | 22 | padding_splitk_matmul | 对齐填充 + Split-K | ✅ | 新增适配器模板 | 模板 | 适用算子 | |------|---------| | BatchedMatmulLike<KernelFn> | 01(3-D 张量批量乘) | | GroupedMatmulLike<KernelFn, SliceDir> | 02/05(分组 slice-M/K) | | GroupedQuantMatmulLike<KernelFn, SliceDir> | 07/10/11(分组量化 scale+per_token_scale) | | 复用现有 MatmulLike / QuantMatmulLike | 09/12/22 | ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!659 | 19 天前 | |
新增44和52样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !647 merge torch_catlass_44_52 into master 新增44和52样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!647 | 26 天前 | |
新增44和52样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !647 merge torch_catlass_44_52 into master 新增44和52样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!647 | 26 天前 | |
新增42样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !631 merge torch_catlass_exp42 into master 新增42样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!631 | 1 个月前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
optest新增部分样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !654 merge optest_long into master optest新增部分样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 新增29、30、32、41、45样例的torch接口至optest ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:接口补齐 See merge request: cann/catlass!654 | 24 天前 | |
新增 01 02 05 07 0910 11 12 22测试接口 Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !659 merge optest into master 新增 01 02 05 07 0910 11 12 22测试接口 Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 | # | 名称 | 分类 | 状态 | |---|------|------|------| | 01 | batched_matmul | 批量矩阵乘 | ✅ | | 02 | grouped_matmul_slice_m | 分组 Slice-M | ✅ | | 05 | grouped_matmul_slice_k | 分组 Slice-K | ✅ | | 07 | grouped_matmul_slice_m_per_token_dequant | 分组 + 量化 Slice-M | ✅ | | 09 | splitk_matmul | 多核 Split-K | ✅ | | 10 | grouped_matmul_slice_m_per_token_dequant_multistage | 分组 + 量化 + 多级 workspace | ✅ | | 11 | grouped_matmul_slice_k_per_token_dequant | 分组 + 量化 Slice-K | ✅ | | 12 | quant_matmul | 量化矩阵乘(多级 workspace) | ✅ | | 22 | padding_splitk_matmul | 对齐填充 + Split-K | ✅ | 新增适配器模板 | 模板 | 适用算子 | |------|---------| | BatchedMatmulLike<KernelFn> | 01(3-D 张量批量乘) | | GroupedMatmulLike<KernelFn, SliceDir> | 02/05(分组 slice-M/K) | | GroupedQuantMatmulLike<KernelFn, SliceDir> | 07/10/11(分组量化 scale+per_token_scale) | | 复用现有 MatmulLike / QuantMatmulLike | 09/12/22 | ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!659 | 19 天前 | |
增加一批matmul测试接口,并补充CI、skill Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !646 merge optest into master 增加一批matmul测试接口,并补充CI、skill Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!646 | 26 天前 | |
optest新增部分样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !654 merge optest_long into master optest新增部分样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 新增29、30、32、41、45样例的torch接口至optest ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:接口补齐 See merge request: cann/catlass!654 | 24 天前 | |
add Ascend950_batched_matmul/grouped_matmul_slice_m_fixpipe_dequant; add 59, 61, 67, 70 for torch_catlass Co-authored-by: CheaterAbec<niyuhao2@huawei.com> Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !706 merge master into master add Ascend950_batched_matmul/grouped_matmul_slice_m_fixpipe_dequant; add 59, 61, 67, 70 for torch_catlass Created-by: CheaterAbec Commit-by: CheaterAbec;init__zhb__ Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 新增ascend950代际的batched_matmul和grouped_matmul_slice_m_fixpipe_dequant算子样例 新增torch_catlass 59,61算子样例接口 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!706 | 11 天前 | |
新增 Ascend950 TailMultiCoreSplitkMatmul Co-authored-by: yjp-hw<yanjiapeng1@huawei.com> # message auto-generated for no-merge-commit merge: !710 merge 69_tailmulti into master 新增 Ascend950 TailMultiCoreSplitkMatmul Created-by: yjp-hw Commit-by: yjp-hw Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 针对特定负载不均衡的Ascend950 matmul场景,新增理论性能更优的切K matmul模板 针对基本块数大于AICORE数且不能被AICORE数整除的场景,新增68_ascend950_multi_core_splitk_matmul ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/249 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!710 | 11 天前 | |
feat(optest): integrate example 38 W4A4 matmul per token per channel dequant Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !719 merge feat/example-38 into master feat(optest): integrate example 38 W4A4 matmul per token per channel dequant Created-by: yuantao_ Commit-by: yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!719 | 5 天前 | |
optest新增部分样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !654 merge optest_long into master optest新增部分样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 新增29、30、32、41、45样例的torch接口至optest ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:接口补齐 See merge request: cann/catlass!654 | 24 天前 | |
optest新增部分样例的torch接口 Co-authored-by: longjihui<longjihui@huawei.com> # message auto-generated for no-merge-commit merge: !654 merge optest_long into master optest新增部分样例的torch接口 Created-by: longjihui Commit-by: longjihui Merged-by: cann-robot Description: ## 描述 新增29、30、32、41、45样例的torch接口至optest ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:接口补齐 See merge request: cann/catlass!654 | 24 天前 |
| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
| 19 小时前 | ||
| 24 天前 | ||
| 24 天前 | ||
| 12 天前 | ||
| 11 天前 | ||
| 5 天前 | ||
| 15 天前 | ||
| 9 天前 | ||
| 10 天前 | ||
| 10 天前 | ||
| 9 天前 | ||
| 9 天前 | ||
| 9 天前 | ||
| 18 天前 | ||
| 12 天前 | ||
| 12 天前 | ||
| 9 天前 | ||
| 1 天前 | ||
| 9 天前 | ||
| 12 天前 | ||
| 11 天前 | ||
| 30 天前 | ||
| 26 天前 | ||
| 26 天前 | ||
| 19 天前 | ||
| 26 天前 | ||
| 16 天前 | ||
| 24 天前 | ||
| 18 天前 | ||
| 19 小时前 | ||
| 19 小时前 | ||
| 19 小时前 | ||
| 19 小时前 | ||
| 16 天前 | ||
| 19 天前 | ||
| 19 天前 | ||
| 19 天前 | ||
| 25 天前 | ||
| 25 天前 | ||
| 26 天前 | ||
| 25 天前 | ||
| 25 天前 | ||
| 25 天前 | ||
| 18 天前 | ||
| 11 天前 | ||
| 26 天前 | ||
| 26 天前 | ||
| 26 天前 | ||
| 19 天前 | ||
| 19 天前 | ||
| 26 天前 | ||
| 26 天前 | ||
| 1 个月前 | ||
| 26 天前 | ||
| 26 天前 | ||
| 24 天前 | ||
| 19 天前 | ||
| 26 天前 | ||
| 24 天前 | ||
| 11 天前 | ||
| 11 天前 | ||
| 5 天前 | ||
| 24 天前 | ||
| 24 天前 |