文件最后提交记录最后更新时间
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
refactor(gmm): 解决gmm的同名 tool.h问题 Co-authored-by: chenbinbin199309<chenbinbin20@huawei.com> # message auto-generated for no-merge-commit merge: !5866 merge h4 into master refactor(gmm): 解决gmm的同名 tool.h问题 Created-by: chenbinbin199309 Commit-by: chenbinbin199309 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 将 gmm 模块下两个功能重复的 tool.h 整合为单一公共头文件: - gmm/grouped_matmul/op_kernel/arch35/weight_quant_basic_block/tool.h - gmm/grouped_matmul_finalize_routing/op_kernel/arch35/common/tool.h 整合后放置于 gmm/common/op_kernel/weight_quant_tool.h ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> Issue [#2660](https://gitcode.com/cann/ops-transformer/issues/2660) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> gmm_finalize_routing_weight_quant和group_matmul多个ttk用例执行通过 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [x] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!58663 天前
modify coord.hpp Co-authored-by: m30040597<maoguolan2@h-partners.com> # message auto-generated for no-merge-commit merge: !4622 merge master into master modify coord.hpp Created-by: m30040597 Commit-by: m30040597 Merged-by: cann-robot Description: ## 描述 定轴算法需求使用了catlass源码,但是catlass更新了include/coord.hpp文件,需要同步 ## 关联的Issue 关联Issue #2071 ## 测试 定轴算法和A4W4优化算法atk用例全部通过 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!46221 个月前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
A4W4优化 Co-authored-by: m30040597<mgl1984@163.com> Co-authored-by: m30040597<maoguolan2@h-partners.com> # message auto-generated for no-merge-commit merge: !2226 merge master into master A4W4优化 Created-by: m30040597 Commit-by: m30040597 Merged-by: cann-robot Description: ## 描述 本次A4W4 perGroup量化GroupMatmul交付说明: 输入类型:INT4\INT4 输入格式:ND\NZ 输出类型:BF16 scale: uint64 pertoken scale:FP32 范围: K: [1k, 16k] N: [128, 16k] E: [1, 256] perM: [16, 10k] quantGroupSize: 256 groupList类型:0:累加 自研效果:本次交付范围最高提升66.9% ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!22262 个月前
A4W4优化 Co-authored-by: m30040597<mgl1984@163.com> Co-authored-by: m30040597<maoguolan2@h-partners.com> # message auto-generated for no-merge-commit merge: !2226 merge master into master A4W4优化 Created-by: m30040597 Commit-by: m30040597 Merged-by: cann-robot Description: ## 描述 本次A4W4 perGroup量化GroupMatmul交付说明: 输入类型:INT4\INT4 输入格式:ND\NZ 输出类型:BF16 scale: uint64 pertoken scale:FP32 范围: K: [1k, 16k] N: [128, 16k] E: [1, 256] perM: [16, 10k] quantGroupSize: 256 groupList类型:0:累加 自研效果:本次交付范围最高提升66.9% ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!22262 个月前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
adding multi weight to a8w4msd op Co-authored-by: huang-jz<huangjunzhe2@h-partners.com> # message auto-generated for no-merge-commit merge: !4783 merge 0427-a8w4-multi-weight into master adding multi weight to a8w4msd op Created-by: huang-jz Commit-by: huang-jz Merged-by: cann-robot Description: ## 描述 GMM A8W4 MSD/伪量化场景支持tensorlist多weight输入 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue #2726 ## 测试 ![image.png](https://raw.gitcode.com/user-images/assets/7673863/8851561b-329c-4b15-984c-c090472f9084/image.png 'image.png') ## 文档更新 更新了GMM V5、GMMWeightNz文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!47832 天前
adding multi weight to a8w4msd op Co-authored-by: huang-jz<huangjunzhe2@h-partners.com> # message auto-generated for no-merge-commit merge: !4783 merge 0427-a8w4-multi-weight into master adding multi weight to a8w4msd op Created-by: huang-jz Commit-by: huang-jz Merged-by: cann-robot Description: ## 描述 GMM A8W4 MSD/伪量化场景支持tensorlist多weight输入 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue #2726 ## 测试 ![image.png](https://raw.gitcode.com/user-images/assets/7673863/8851561b-329c-4b15-984c-c090472f9084/image.png 'image.png') ## 文档更新 更新了GMM V5、GMMWeightNz文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!47832 天前
adding multi weight to a8w4msd op Co-authored-by: huang-jz<huangjunzhe2@h-partners.com> # message auto-generated for no-merge-commit merge: !4783 merge 0427-a8w4-multi-weight into master adding multi weight to a8w4msd op Created-by: huang-jz Commit-by: huang-jz Merged-by: cann-robot Description: ## 描述 GMM A8W4 MSD/伪量化场景支持tensorlist多weight输入 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue #2726 ## 测试 ![image.png](https://raw.gitcode.com/user-images/assets/7673863/8851561b-329c-4b15-984c-c090472f9084/image.png 'image.png') ## 文档更新 更新了GMM V5、GMMWeightNz文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!47832 天前
同步GMM代码 Co-authored-by: Hu1L1<chenshujian5@huawei.com> # message auto-generated for no-merge-commit merge: !546 merge move_all into master 同步GMM代码 Created-by: Hu1L1 Commit-by: Hu1L1 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!5465 个月前
adding multi weight to a8w4msd op Co-authored-by: huang-jz<huangjunzhe2@h-partners.com> # message auto-generated for no-merge-commit merge: !4783 merge 0427-a8w4-multi-weight into master adding multi weight to a8w4msd op Created-by: huang-jz Commit-by: huang-jz Merged-by: cann-robot Description: ## 描述 GMM A8W4 MSD/伪量化场景支持tensorlist多weight输入 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue #2726 ## 测试 ![image.png](https://raw.gitcode.com/user-images/assets/7673863/8851561b-329c-4b15-984c-c090472f9084/image.png 'image.png') ## 文档更新 更新了GMM V5、GMMWeightNz文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!47832 天前
Revert: [GMM][QGMMIA]算子tilingData注册方式修改 Co-authored-by: Hu1L1<chenshujian5@huawei.com> # message auto-generated for no-merge-commit merge: !5849 merge revert-mr-5456-1779679827345-auto into master Revert: [GMM][QGMMIA]算子tilingData注册方式修改 Created-by: Hu1L1 Commit-by: Hu1L1 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> Revert 回退 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2528 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 二级冒烟 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [x] ❓ 其他,请描述:回退代码 See merge request: cann/ops-transformer!58494 天前
fix: change Temp_A_Offset type to uint64_t to prevent overflow Co-authored-by: zhouhuaman<zhouhuaman2@huawei.com> # message auto-generated for no-merge-commit merge: !4123 merge master into master fix: change Temp_A_Offset type to uint64_t to prevent overflow Created-by: zhou_huaman Commit-by: zhouhuaman Merged-by: cann-robot Description: ## 描述 change Temp_A_Offset type to uint64_t to prevent overflow ## 关联的Issue 关联issue https://gitcode.com/cann/ops-transformer/issues/1890?ref=&did=3855286#tid-3855286 ## 测试 功能泛化测试 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [x] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!41231 个月前
同步GMM代码 Co-authored-by: Hu1L1<chenshujian5@huawei.com> # message auto-generated for no-merge-commit merge: !546 merge move_all into master 同步GMM代码 Created-by: Hu1L1 Commit-by: Hu1L1 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!5465 个月前
同步GMM代码 Co-authored-by: Hu1L1<chenshujian5@huawei.com> # message auto-generated for no-merge-commit merge: !546 merge move_all into master 同步GMM代码 Created-by: Hu1L1 Commit-by: Hu1L1 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!5465 个月前
同步GMM代码 Co-authored-by: Hu1L1<chenshujian5@huawei.com> # message auto-generated for no-merge-commit merge: !546 merge move_all into master 同步GMM代码 Created-by: Hu1L1 Commit-by: Hu1L1 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!5465 个月前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前
GMM support groupListType=2 Co-authored-by: lijiamin<lijiamin24@huawei.com> # message auto-generated for no-merge-commit merge: !4844 merge gmm2 into master GMM support groupListType=2 Created-by: lijiamin2025 Commit-by: lijiamin Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 改动原因: 支持groupList的稀疏模式,Gmm算子极致低延时 改动点: 非耦合改动:新增XXXMSparse类处理groupListType=2的场景 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2484 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> A4W4_Sparse ATK A16W4/A16W8_Sparse ATK noquant_Sparse ATK ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 本PR不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!48442 天前