文件最后提交记录最后更新时间
clean code 1 个月前
feat: bench_lite multi-mode runner 增强与安全加固 - 新增 performance / full 模式:支持性能评测、评分、排行榜、submission 提取 - 新增 --team-name 路径穿越防御(validate_team_name) - 新增 --backend all 与 --arch/--dsl/--backend-name 互斥校验 - 新增 --backends 参数(仅 --backend all 模式,支持子集选择与去重) - 统一 payload schema:config 包含 team_name/workflow/backend_name/backends - 修复 box-drawing 字符乱码(替换为 ASCII 分隔线) - 子进程隔离性能评测(multiprocessing spawn 模式,超时 terminate/kill) - 更新 RUNNER.md 文档 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com> 2 个月前
refactor: rename project from aikg to akg_agents Complete project renaming: - Renamed main directory: aikg/ -> akg_agents/ - Renamed Python package: ai_kernel_generator -> akg_agents - Renamed benchmark: aikgbench -> akg_kernels_bench - Updated client API: AIKGClient -> AKGAgentsClient - Updated all import paths and module references - Updated environment variables: AIKG_* -> AKG_AGENTS_* - Updated output directories and log paths - Updated all documentation and configuration files - Fixed Git submodules paths Breaking changes: - All Python imports need to update to 'from akg_agents' - Environment variable names changed: AIKG_* -> AKG_AGENTS_* - Package name changed from ai_kernel_generator to akg_agents - Client class renamed: AIKGClient -> AKGAgentsClient Co-authored-by: Cursor <cursoragent@cursor.com> 3 个月前
refactor: unify benchmark downloads and remove submodules 1 个月前
refactor: unify benchmark downloads and remove submodules 1 个月前
refactor: unify benchmark downloads and remove submodules 1 个月前
README.md

Benchmark

概述

本 benchmark 基于AI Kernel 生成评测集 KernelBench,我们在此基础上进行了前端框架的迁移和结构的合理化调整。

kernelbench目录下,存放了我们为 KernelBench 任务适配的 MindSpore 和 NumPy 实现。原始的 PyTorch 实现通过 bash download.sh --with_kernelbench 下载到 ../thirdparty/KernelBench,从而实现了对不同计算框架的广泛支持和验证。

akg_kernels_bench目录下,提供akg_agents项目中有较高使用价值的Kernel场景,整理成对应的benchmark:

  • vLLM: 基于 vLLM 推理引擎的高性能算子,包括注意力机制、归一化层、位置编码等核心组件
  • SGLang: 基于 SGLang 的高效推理算子,专注于优化的注意力kernel和状态管理
  • Attention Kernels: 基于 attention_kernel_triton 的Flash Attention实现变体,提供prefill、decode、sparse token等多种attention模式