| mega_moe supports A8W4&A4W4
Co-authored-by: OblivionZHU<zhujun116@huawei.com>
# message auto-generated for no-merge-commit merge:
!5030 merge master into master
mega_moe supports A8W4&A4W4
Created-by: OblivionZHU
Commit-by: OblivionZHU
Merged-by: cann-robot
Description: ## 描述
在 mega_moe 算子的 FFN 阶段或相关通信路径中新增 FP4 量化类型支持,通过更低 bit-width 的数据表示进一步压缩通信数据量,提升 MoE 算子在大模型训练/推理中的整体性能。
## 关联的Issue
[Requirement|需求建议]: mega_moe算子建议新增量化类型
## 测试
codecheck、蓝区冒烟、本地RDV
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [ ] 🐛 Bug 修复
- [x] ✨ 新特性
- [ ] ⚡ 性能优化
- [ ] ♻️ 重构
- [ ] 🧪 测试
- [ ] 📦 构建/CI
- [ ] 🔧 配置变更
- [ ] 📝 文档更新
- [ ] ⬆️ 依赖升级
- [ ] 🔒 安全修复
- [ ] 🧹 代码清理
- [ ] ❓ 其他,请描述:
See merge request: cann/ops-transformer!5030 | 10 天前 |