0
代码介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
0
  1. akg
  2. /
  3. akg_agents
  4. /
  5. database
  6. /
  7. local
  8. /
  9. a100
yiyanzhi_akane1yiyanzhi_akane1feat: 完善attention kernel生成框架并添加测试工具
08696c7d创建于 3月14日历史提交
文件最后提交记录最后更新时间
triton_cuda
feat: 完善attention kernel生成框架并添加测试工具 - Attention kernel生成与优化:添加AI生成代码框架、昇腾平台测试、float16数据类型优化及CPU兼容性改进 - 测试工具:添加AKG Kernels Bench Lite批量测试脚本和torch CUDA Triton批量attention测试 - 文档更新:重构triton-cuda-attention SKILL文档至v2.0,添加OpenMP并行编程约束文档 - 架构重构:将verifier模块从core层迁移至op层 - 修复与清理:修复A100 flash attention数据库引用、API 403问题,清理临时测试文件 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com> 2 个月前