文件最后提交记录最后更新时间
add grouped_matmul_swiglu_quant_v2 mxquant nz Co-authored-by: LSYlsy0214<liushiyu25@h-partners.com> # message auto-generated for no-merge-commit merge: !4709 merge master into master add grouped_matmul_swiglu_quant_v2 mxquant nz Created-by: LSYlsy0214 Commit-by: LSYlsy0214 Merged-by: cann-robot Description: ## 描述 grouped_matmul_swiglu_quant_v2算子,mxfp8场景,新增支持weightNZ特性 ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/2148 ## 测试 ttk/aclnn/torch单算子图模式 验证100条门槛用例 + RDV冒烟测试通过 ## 文档更新 修改aclnnGroupedMatmulSwigluQuantWeightNzV2.md文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!47091 个月前
refactor(gmm): move fallback sources to op_graph Co-authored-by: smdbha<panzhijie2@huawei.com> # message auto-generated for no-merge-commit merge: !3247 merge master into master refactor(gmm): move fallback sources to op_graph Created-by: smdbha Commit-by: smdbha Merged-by: cann-robot Description: ## 描述 本次改动对部分 GMM 模块的目录结构进行了统一整理,核心目标是将 op_apiop_host 中独立出来,并将图侧 fallback_*.cpp 移动到同级 op_graph 目录。 本次涉及模块如下: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 具体改动包括: 1. 将以下模块中的 op_host/op_api 调整为同级 op_api: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 2. 将以下模块中的 fallback_*.cppop_host 移动到同级 op_graph: - grouped_matmul - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 3. 修改对应 op_host/CMakeLists.txt,适配独立后的 op_api 目录: - 增加 OP_API_INDEPENDENT ON - 增加 OP_API_DIR ${CMAKE_CURRENT_SOURCE_DIR}/../op_api 4. 同步修正相关引用关系: - 更新 UT 中受影响的 include 路径 - 更新 classify_rule.yamlgrouped_matmulop_api 路径 - 修正 gmm/grouped_matmul/op_api/aclnn_grouped_matmul.cppgrouped_matmul_host_util.h 的相对 include 路径 - 删除迁移过程中新增的 CMake 说明性注释,保持脚本整洁 本次改动以目录整理和构建适配为主,不涉及算子功能逻辑变更。 ## 关联Issue 关联 Issue:#1421 ## 测试 已完成以下检查: - 检查相关模块目录结构,确认迁移后 op_apiop_graph 布局符合预期 - 检查旧路径残留,确认相关模块中不再保留旧的 op_host/op_api 目录引用 - 检查 fallback_*.cpp 已从 op_host 移动到对应 op_graph - 检查 CMakeLists.txt、UT 路径和 classify_rule.yaml 已同步更新 ## 文档更新 无 ## 类型标签 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [x] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [x] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!32472 个月前
aclnn_grouped_matmul_swiglu_quant_weight_nz_v2约束更新 Co-authored-by: LSYlsy0214<liushiyu25@h-partners.com> # message auto-generated for no-merge-commit merge: !5400 merge master into master aclnn_grouped_matmul_swiglu_quant_weight_nz_v2约束更新 Created-by: LSYlsy0214 Commit-by: LSYlsy0214 Merged-by: cann-robot Description: ## 描述 aclnn_grouped_matmul_swiglu_quant_weight_nz_v2约束更新 ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/2473 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!540018 天前
四月sc清理 Co-authored-by: huangkejie1647<huangkejie3@huawei.com> # message auto-generated for no-merge-commit merge: !3962 merge fix_trunk_transformer into master 四月sc清理 Created-by: huangkejie1647 Commit-by: huangkejie1647 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 四月sc清理 本次PR对分组矩阵乘法(Grouped Matmul)操作中与量化相关的参数检查逻辑进行了重构和优化。主要解决了原代码中存在的魔术数字(Magic Number)问题,提升了代码的可读性和可维护性,并统一了伪量化场景下反量化缩放因子(antiquantScale)的维度检查逻辑。 在 gmm/grouped_matmul/op_api/aclnn_grouped_matmul.cpp 文件中,通过引入三个具名常量(ANTIQUANT_SCALE_3D_DIMS、ANTIQUANT_SCALE_4D_DIMS、SCALE_TENSOR_EXPECTED_DIMS)来分别表示不同场景下缩放因子的预期维度。随后,在 CheckScaleForInt8Quant 和 SetTransposedScaleTensorListContiguous 函数中将原有的硬编码数字替换为这些常量,使代码意图更清晰,便于未来统一维护。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> Issue [#1820](https://gitcode.com/cann/ops-transformer/issues/1820) <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 本地编译验证 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [x] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!39621 个月前
refactor(gmm): move fallback sources to op_graph Co-authored-by: smdbha<panzhijie2@huawei.com> # message auto-generated for no-merge-commit merge: !3247 merge master into master refactor(gmm): move fallback sources to op_graph Created-by: smdbha Commit-by: smdbha Merged-by: cann-robot Description: ## 描述 本次改动对部分 GMM 模块的目录结构进行了统一整理,核心目标是将 op_apiop_host 中独立出来,并将图侧 fallback_*.cpp 移动到同级 op_graph 目录。 本次涉及模块如下: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 具体改动包括: 1. 将以下模块中的 op_host/op_api 调整为同级 op_api: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 2. 将以下模块中的 fallback_*.cppop_host 移动到同级 op_graph: - grouped_matmul - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 3. 修改对应 op_host/CMakeLists.txt,适配独立后的 op_api 目录: - 增加 OP_API_INDEPENDENT ON - 增加 OP_API_DIR ${CMAKE_CURRENT_SOURCE_DIR}/../op_api 4. 同步修正相关引用关系: - 更新 UT 中受影响的 include 路径 - 更新 classify_rule.yamlgrouped_matmulop_api 路径 - 修正 gmm/grouped_matmul/op_api/aclnn_grouped_matmul.cppgrouped_matmul_host_util.h 的相对 include 路径 - 删除迁移过程中新增的 CMake 说明性注释,保持脚本整洁 本次改动以目录整理和构建适配为主,不涉及算子功能逻辑变更。 ## 关联Issue 关联 Issue:#1421 ## 测试 已完成以下检查: - 检查相关模块目录结构,确认迁移后 op_apiop_graph 布局符合预期 - 检查旧路径残留,确认相关模块中不再保留旧的 op_host/op_api 目录引用 - 检查 fallback_*.cpp 已从 op_host 移动到对应 op_graph - 检查 CMakeLists.txt、UT 路径和 classify_rule.yaml 已同步更新 ## 文档更新 无 ## 类型标签 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [x] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [x] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!32472 个月前
refactor(gmm): move fallback sources to op_graph Co-authored-by: smdbha<panzhijie2@huawei.com> # message auto-generated for no-merge-commit merge: !3247 merge master into master refactor(gmm): move fallback sources to op_graph Created-by: smdbha Commit-by: smdbha Merged-by: cann-robot Description: ## 描述 本次改动对部分 GMM 模块的目录结构进行了统一整理,核心目标是将 op_apiop_host 中独立出来,并将图侧 fallback_*.cpp 移动到同级 op_graph 目录。 本次涉及模块如下: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 具体改动包括: 1. 将以下模块中的 op_host/op_api 调整为同级 op_api: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 2. 将以下模块中的 fallback_*.cppop_host 移动到同级 op_graph: - grouped_matmul - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 3. 修改对应 op_host/CMakeLists.txt,适配独立后的 op_api 目录: - 增加 OP_API_INDEPENDENT ON - 增加 OP_API_DIR ${CMAKE_CURRENT_SOURCE_DIR}/../op_api 4. 同步修正相关引用关系: - 更新 UT 中受影响的 include 路径 - 更新 classify_rule.yamlgrouped_matmulop_api 路径 - 修正 gmm/grouped_matmul/op_api/aclnn_grouped_matmul.cppgrouped_matmul_host_util.h 的相对 include 路径 - 删除迁移过程中新增的 CMake 说明性注释,保持脚本整洁 本次改动以目录整理和构建适配为主,不涉及算子功能逻辑变更。 ## 关联Issue 关联 Issue:#1421 ## 测试 已完成以下检查: - 检查相关模块目录结构,确认迁移后 op_apiop_graph 布局符合预期 - 检查旧路径残留,确认相关模块中不再保留旧的 op_host/op_api 目录引用 - 检查 fallback_*.cpp 已从 op_host 移动到对应 op_graph - 检查 CMakeLists.txt、UT 路径和 classify_rule.yaml 已同步更新 ## 文档更新 无 ## 类型标签 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [x] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [x] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!32472 个月前
refactor(gmm): move fallback sources to op_graph Co-authored-by: smdbha<panzhijie2@huawei.com> # message auto-generated for no-merge-commit merge: !3247 merge master into master refactor(gmm): move fallback sources to op_graph Created-by: smdbha Commit-by: smdbha Merged-by: cann-robot Description: ## 描述 本次改动对部分 GMM 模块的目录结构进行了统一整理,核心目标是将 op_apiop_host 中独立出来,并将图侧 fallback_*.cpp 移动到同级 op_graph 目录。 本次涉及模块如下: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 具体改动包括: 1. 将以下模块中的 op_host/op_api 调整为同级 op_api: - grouped_matmul - grouped_matmul_add - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 2. 将以下模块中的 fallback_*.cppop_host 移动到同级 op_graph: - grouped_matmul - grouped_matmul_finalize_routing - grouped_matmul_swiglu_quant_v2 - quant_grouped_matmul_inplace_add 3. 修改对应 op_host/CMakeLists.txt,适配独立后的 op_api 目录: - 增加 OP_API_INDEPENDENT ON - 增加 OP_API_DIR ${CMAKE_CURRENT_SOURCE_DIR}/../op_api 4. 同步修正相关引用关系: - 更新 UT 中受影响的 include 路径 - 更新 classify_rule.yamlgrouped_matmulop_api 路径 - 修正 gmm/grouped_matmul/op_api/aclnn_grouped_matmul.cppgrouped_matmul_host_util.h 的相对 include 路径 - 删除迁移过程中新增的 CMake 说明性注释,保持脚本整洁 本次改动以目录整理和构建适配为主,不涉及算子功能逻辑变更。 ## 关联Issue 关联 Issue:#1421 ## 测试 已完成以下检查: - 检查相关模块目录结构,确认迁移后 op_apiop_graph 布局符合预期 - 检查旧路径残留,确认相关模块中不再保留旧的 op_host/op_api 目录引用 - 检查 fallback_*.cpp 已从 op_host 移动到对应 op_graph - 检查 CMakeLists.txt、UT 路径和 classify_rule.yaml 已同步更新 ## 文档更新 无 ## 类型标签 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [x] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [x] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!32472 个月前
add grouped_matmul_swiglu_quant_v2 mxquant nz Co-authored-by: LSYlsy0214<liushiyu25@h-partners.com> # message auto-generated for no-merge-commit merge: !4709 merge master into master add grouped_matmul_swiglu_quant_v2 mxquant nz Created-by: LSYlsy0214 Commit-by: LSYlsy0214 Merged-by: cann-robot Description: ## 描述 grouped_matmul_swiglu_quant_v2算子,mxfp8场景,新增支持weightNZ特性 ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/2148 ## 测试 ttk/aclnn/torch单算子图模式 验证100条门槛用例 + RDV冒烟测试通过 ## 文档更新 修改aclnnGroupedMatmulSwigluQuantWeightNzV2.md文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!47091 个月前