| cleanup: 删除flash_attn中无用的postQuantScale/postQuantOffset/NTD/NBSD/OUT_T/FLASH_DECODE代码
Co-authored-by: haijie_699874<zhanghaijie4@hisilicon.com>
# message auto-generated for no-merge-commit merge:
!5542 merge flash_attn_clear into master
cleanup: 删除flash_attn中无用的postQuantScale/postQuantOffset/NTD/NBSD/OUT_T/FLASH_DECODE代码
Created-by: haijie_699874
Commit-by: haijie_699874
Merged-by: cann-robot
Description: ## 描述
<!--在这里详细描述你的改动,包括改动的原因和所采取的方法。-->
针对flash_attn算子
- 把全局清零逻辑改成在传入seqUsed时才清零
- 删除VecBlockBase和FANoQuantGqaBlockVec中未使用的postQuantScale/postQuantOffset参数、类型别名和成员变量
- 删除OUT_T别名,直接使用OUTPUT_T
- 删除NTD layout相关判断和分支
- 删除NBSD layout分支
- FLASH_DECODE编译期常量替换为运行时bool isFd成员变量
- 清理模板参数isFd,改为运行时赋值传递
## 关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000-->
<!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。-->
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
不涉及
## 类型标签
<!-- [x] 表示选中 -->
- [x] 🐛 Bug 修复
- [ ] ✨ 新特性
- [ ] ⚡ 性能优化
- [ ] ♻️ 重构
- [ ] 🧪 测试
- [ ] 📦 构建/CI
- [ ] 🔧 配置变更
- [ ] 📝 文档更新
- [ ] ⬆️ 依赖升级
- [ ] 🔒 安全修复
- [ ] 🧹 代码清理
- [ ] ❓ 其他,请描述:
See merge request: cann/ops-transformer!5542 | 13 天前 |