| A4W4优化
Co-authored-by: m30040597<mgl1984@163.com>
Co-authored-by: m30040597<maoguolan2@h-partners.com>
# message auto-generated for no-merge-commit merge:
!2226 merge master into master
A4W4优化
Created-by: m30040597
Commit-by: m30040597
Merged-by: cann-robot
Description: ## 描述
本次A4W4 perGroup量化GroupMatmul交付说明:
输入类型:INT4\INT4
输入格式:ND\NZ
输出类型:BF16
scale: uint64
pertoken scale:FP32
范围:
K: [1k, 16k]
N: [128, 16k]
E: [1, 256]
perM: [16, 10k]
quantGroupSize: 256
groupList类型:0:累加
自研效果:本次交付范围最高提升66.9%
## 关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000-->
<!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。-->
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [ ] Bug修复
- [ ] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/ops-transformer!2226 | 2 个月前 |