文件最后提交记录最后更新时间
refactor: rm old yaml and examples 3 个月前
adapt sol benchmark 1 个月前
refactor: unify benchmark downloads and remove submodules 1 个月前
feat: 完善attention kernel生成框架并添加测试工具 - Attention kernel生成与优化:添加AI生成代码框架、昇腾平台测试、float16数据类型优化及CPU兼容性改进 - 测试工具:添加AKG Kernels Bench Lite批量测试脚本和torch CUDA Triton批量attention测试 - 文档更新:重构triton-cuda-attention SKILL文档至v2.0,添加OpenMP并行编程约束文档 - 架构重构:将verifier模块从core层迁移至op层 - 修复与清理:修复A100 flash attention数据库引用、API 403问题,清理临时测试文件 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com> 2 个月前
update run attention examples Made-with: Cursor 2 个月前
feat: bench_lite multi-mode runner 增强与安全加固 - 新增 performance / full 模式:支持性能评测、评分、排行榜、submission 提取 - 新增 --team-name 路径穿越防御(validate_team_name) - 新增 --backend all 与 --arch/--dsl/--backend-name 互斥校验 - 新增 --backends 参数(仅 --backend all 模式,支持子集选择与去重) - 统一 payload schema:config 包含 team_name/workflow/backend_name/backends - 修复 box-drawing 字符乱码(替换为 ASCII 分隔线) - 子进程隔离性能评测(multiprocessing spawn 模式,超时 terminate/kill) - 更新 RUNNER.md 文档 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com> 2 个月前
feat: 完善attention kernel生成框架并添加测试工具 - Attention kernel生成与优化:添加AI生成代码框架、昇腾平台测试、float16数据类型优化及CPU兼容性改进 - 测试工具:添加AKG Kernels Bench Lite批量测试脚本和torch CUDA Triton批量attention测试 - 文档更新:重构triton-cuda-attention SKILL文档至v2.0,添加OpenMP并行编程约束文档 - 架构重构:将verifier模块从core层迁移至op层 - 修复与清理:修复A100 flash attention数据库引用、API 403问题,清理临时测试文件 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com> 2 个月前
update configs 3 个月前
refactor: rm old yaml and examples 3 个月前