Fork
0
代码
介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
Fork
0
2fb644d4a0417c15995a9c09f71888f2604cfd00
ops-transformer
/
attention
/
nsa_compress_with_cache
/
examples
下载当前目录
cann-robot
匹配最新cann版本,上线新版本attention/ffn/moe/posembedding算子
e05d98c2
创建于
2025年12月21日
历史提交
文件
最后提交记录
最后更新时间
test_aclnn_nsa_compress_with_cache.cpp
匹配最新cann版本,上线新版本attention/ffn/moe/posembedding算子 Co-authored-by: huangchuhong<huangchuhong1@h-partners.com> # message auto-generated for no-merge-commit merge:
!538
merge master into master 匹配最新cann版本,上线新版本attention/ffn/moe/posembedding算子 Created-by: huang-chuhong Commit-by: huangchuhong Merged-by: cann-robot Description: ## 描述 transformer 同步算子最新开发,涉及attention/ffn/moe/posembedding ## 关联的Issue
https://gitcode.com/cann/ops-transformer/issues/315
## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer
!538
5 个月前