README.md

Benchmark

概述

本 benchmark 基于AI Kernel 生成评测集 KernelBench,我们在此基础上进行了前端框架的迁移和结构的合理化调整。

kernelbench目录下,存放了我们为 KernelBench 任务适配的 MindSpore 和 NumPy 实现。原始的 PyTorch 实现通过 bash download.sh --with_kernelbench 下载到 ../thirdparty/KernelBench,从而实现了对不同计算框架的广泛支持和验证。

akg_kernels_bench目录下,提供akg_agents项目中有较高使用价值的Kernel场景,整理成对应的benchmark:

  • vLLM: 基于 vLLM 推理引擎的高性能算子,包括注意力机制、归一化层、位置编码等核心组件
  • SGLang: 基于 SGLang 的高效推理算子,专注于优化的注意力kernel和状态管理
  • Attention Kernels: 基于 attention_kernel_triton 的Flash Attention实现变体,提供prefill、decode、sparse token等多种attention模式