文件最后提交记录最后更新时间
transformer类onnx算子插件支持 Co-authored-by: xuyang12138<xuyang270@huawei.com> # message auto-generated for no-merge-commit merge: !539 merge master into master transformer类onnx算子插件支持 Created-by: yanke-xu Commit-by: xuyang12138 Merged-by: cann-robot Description: ## 描述 transformer类onnx算子插件支持,包含以下onnx算子类型: 1. NPUFlashAttention 2. NPUIncreFlashAttention 3. NPUPromptFlashAttention 4. EmbeddingBag 5. FillWindowCache 6. NPUMultiHeadAttention 7. NPUFusedAttentionScoreFwd 8. NPUFusedAttentionScore 9. NPUMaskedSoftmaxWithRelPosBias 10. NPUScaledMaskedSoftmax 11. TfIdfVectorizer 12. NPUMoeComputeExpertTokens 13. NPUMoeFinalizeRouting 14. NPUMoeFinalizeRoutingV2 15. NPUMoeGatingTopKSoftmax 16. NPUMoeInitRouting 17. NPURotaryPositionEmbedding ## 关联的Issue None ## 测试 流水线验证 ## 文档更新 None ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!5394 个月前
移动opapi目录 Co-authored-by: linengyao<linengyao@huawei.com> # message auto-generated for no-merge-commit merge: !3313 merge opapi_change_dir into master 移动opapi目录 Created-by: linengyao Commit-by: linengyao Merged-by: cann-robot Description: ## 描述 修改opapi目录至op_host同级 修改fallback文件至op_graph目录下 ## 关联的Issue [#1522](https://gitcode.com/cann/ops-transformer/issues/1522) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!33132 个月前
transformer类onnx算子插件支持 Co-authored-by: xuyang12138<xuyang270@huawei.com> # message auto-generated for no-merge-commit merge: !539 merge master into master transformer类onnx算子插件支持 Created-by: yanke-xu Commit-by: xuyang12138 Merged-by: cann-robot Description: ## 描述 transformer类onnx算子插件支持,包含以下onnx算子类型: 1. NPUFlashAttention 2. NPUIncreFlashAttention 3. NPUPromptFlashAttention 4. EmbeddingBag 5. FillWindowCache 6. NPUMultiHeadAttention 7. NPUFusedAttentionScoreFwd 8. NPUFusedAttentionScore 9. NPUMaskedSoftmaxWithRelPosBias 10. NPUScaledMaskedSoftmax 11. TfIdfVectorizer 12. NPUMoeComputeExpertTokens 13. NPUMoeFinalizeRouting 14. NPUMoeFinalizeRoutingV2 15. NPUMoeGatingTopKSoftmax 16. NPUMoeInitRouting 17. NPURotaryPositionEmbedding ## 关联的Issue None ## 测试 流水线验证 ## 文档更新 None ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!5394 个月前