文件最后提交记录最后更新时间
SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 Co-authored-by: INeedAnID<panjie38@huawei.com> # message auto-generated for no-merge-commit merge: !4962 merge lse into master SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 Created-by: INeedAnID Commit-by: INeedAnID Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!496225 天前
重构测试框架:sparse_flash_attention lse适配及路径3适配 Co-authored-by: INeedAnID<panjie38@huawei.com> # message auto-generated for no-merge-commit merge: !4843 merge sfa_qsfa_repair into master 重构测试框架:sparse_flash_attention lse适配及路径3适配 Created-by: INeedAnID Commit-by: INeedAnID Merged-by: cann-robot Description: ## 描述 本次重构优化了 sparse_flash_attention 和 kv_quant_sparse_flash_attention 两个算子的测试框架,新增从 paramset 生成 Excel 功能,支持自定义张量数值范围,改进 actual_seq 生成逻辑,并增强异常处理和测试失败信息显示,提升测试效率和可调试性。 增加sparse_flash_attention的LSE返回值校验 新增路径3调用适配 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!484327 天前
SFA添加Pytest测试框架 Co-authored-by: j60100428<jingsong5@h-partners.com> # message auto-generated for no-merge-commit merge: !3985 merge master into master SFA添加Pytest测试框架 Created-by: SH_jingsong Commit-by: j60100428 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!39851 个月前
fix: VF分组补充和cleancode Co-authored-by: j60100428<jingsong5@h-partners.com> # message auto-generated for no-merge-commit merge: !6019 merge master into master fix: VF分组补充和cleancode Created-by: SH_jingsong Commit-by: j60100428 Merged-by: cann-robot Description: ## 描述 VF分组补充和cleancode ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/2714 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!60196 天前
重构测试框架:sparse_flash_attention lse适配及路径3适配 Co-authored-by: INeedAnID<panjie38@huawei.com> # message auto-generated for no-merge-commit merge: !4843 merge sfa_qsfa_repair into master 重构测试框架:sparse_flash_attention lse适配及路径3适配 Created-by: INeedAnID Commit-by: INeedAnID Merged-by: cann-robot Description: ## 描述 本次重构优化了 sparse_flash_attention 和 kv_quant_sparse_flash_attention 两个算子的测试框架,新增从 paramset 生成 Excel 功能,支持自定义张量数值范围,改进 actual_seq 生成逻辑,并增强异常处理和测试失败信息显示,提升测试效率和可调试性。 增加sparse_flash_attention的LSE返回值校验 新增路径3调用适配 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!484327 天前
SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 Co-authored-by: INeedAnID<panjie38@huawei.com> # message auto-generated for no-merge-commit merge: !4962 merge lse into master SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 Created-by: INeedAnID Commit-by: INeedAnID Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!496225 天前
QSFA添加Pytest测试框架(支持NPU) Co-authored-by: j60100428<jingsong5@h-partners.com> # message auto-generated for no-merge-commit merge: !3746 merge master into master QSFA添加Pytest测试框架(支持NPU) Created-by: SH_jingsong Commit-by: j60100428 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!37461 个月前
QSFA添加Pytest测试框架(支持NPU) Co-authored-by: j60100428<jingsong5@h-partners.com> # message auto-generated for no-merge-commit merge: !3746 merge master into master QSFA添加Pytest测试框架(支持NPU) Created-by: SH_jingsong Commit-by: j60100428 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!37461 个月前
重构测试框架:sparse_flash_attention lse适配及路径3适配 Co-authored-by: INeedAnID<panjie38@huawei.com> # message auto-generated for no-merge-commit merge: !4843 merge sfa_qsfa_repair into master 重构测试框架:sparse_flash_attention lse适配及路径3适配 Created-by: INeedAnID Commit-by: INeedAnID Merged-by: cann-robot Description: ## 描述 本次重构优化了 sparse_flash_attention 和 kv_quant_sparse_flash_attention 两个算子的测试框架,新增从 paramset 生成 Excel 功能,支持自定义张量数值范围,改进 actual_seq 生成逻辑,并增强异常处理和测试失败信息显示,提升测试效率和可调试性。 增加sparse_flash_attention的LSE返回值校验 新增路径3调用适配 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!484327 天前
重构测试框架:sparse_flash_attention lse适配及路径3适配 Co-authored-by: INeedAnID<panjie38@huawei.com> # message auto-generated for no-merge-commit merge: !4843 merge sfa_qsfa_repair into master 重构测试框架:sparse_flash_attention lse适配及路径3适配 Created-by: INeedAnID Commit-by: INeedAnID Merged-by: cann-robot Description: ## 描述 本次重构优化了 sparse_flash_attention 和 kv_quant_sparse_flash_attention 两个算子的测试框架,新增从 paramset 生成 Excel 功能,支持自定义张量数值范围,改进 actual_seq 生成逻辑,并增强异常处理和测试失败信息显示,提升测试效率和可调试性。 增加sparse_flash_attention的LSE返回值校验 新增路径3调用适配 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!484327 天前
fix: clean code Co-authored-by: j60100428<jingsong5@h-partners.com> # message auto-generated for no-merge-commit merge: !6033 merge master into master fix: clean code Created-by: SH_jingsong Commit-by: j60100428 Merged-by: cann-robot Description: ## 描述 fix: clean code ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/2731 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!60335 天前
SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 Co-authored-by: INeedAnID<panjie38@huawei.com> # message auto-generated for no-merge-commit merge: !4962 merge lse into master SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 Created-by: INeedAnID Commit-by: INeedAnID Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> SFA删除Testcase_Number,添加从excel读取文件和保存结果return_softmax_lse支持 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!496225 天前
README.md

kv_quant_sparse_flash_attention pytest 测试框架

功能说明

基于pytest测试框架,实现 kv_quant_sparse_flash_attention 算子的功能验证:

  • CPU侧:复现算子功能用以生成golden数据
  • NPU侧:通过torch_npu进行算子直调获取实际数据
  • 精度对比:进行CPU与NPU结果的精度对比验证算子功能

支持三条主流程:

  • single:基于 kv_quant_sparse_flash_attention_paramset.py 的固定参数直接构造输入并拉起 NPU 单算子执行。
  • batch_save:从 Excel 读取参数,生成包含 CPU golden 的 .pt 用例文件。
  • gen_excel_from_paramset:从 paramset 生成 Excel 文件。
  • batch_exec:从已有 .pt 文件批量回放执行 NPU 算子并对比精度。

当前实现范围

参数说明

以下参数约束已经下沉到框架校验和本文档中,便于统一维护:

  • layout_query: 支持 BSNDTND
  • layout_kv: 支持 BSNDTNDPA_BSND
  • 非 PA 场景要求 layout_query == layout_kv
  • q_type: 仅支持 torch.float16torch.bfloat16
  • kv_dtype: 支持 hifloat8float8_e4m3fn,也兼容 None 作为 float8_e4m3fn 默认生成路径
  • N1: 仅支持 1/2/4/8/16/32/48/64
  • N2: 仅支持 1
  • sparse_mode: 仅支持 03
  • sparse_block_size: 当前仅支持 1
  • key_quant_mode / value_quant_mode: 仅支持 2
  • tile_size: 当前仅支持 128
  • quant_scale_repo_mode: 当前仅支持 1
  • attention_mode: 支持 02;当取 2 时,rope_head_dim 必须为 64
  • block_size: 仅在 PA_BSND 生效,且要求为 16 的倍数
  • actual_seq_q / actual_seq_kv: 如果传入,长度必须等于 B

更完整的算子定义和输入约束,请同步参考:

  • attention/kv_quant_sparse_flash_attention/README.md

环境配置

前置要求

1、 确认torch_npu为最新版本 2、 参考Attention融合算子Experimental使用说明激活CANN包和自定义算子包

custom包调用

支持custom包调用

文件结构

pytest/
├── README.md
├── pytest.ini			# 创建测试标记
├── test_run.sh			# 执行脚本
├── check_valid_param.py			# 参数约束拦截
├── kv_quant_sparse_flash_attention_golden.py		# tensor转换/cpu侧算子golden实现
├── kv_quant_sparse_flash_attention_paramset.py		# 单用例入参配置
├── result_compare_method.py		# 输出精度对比
├── utils.py			# 参数解析/cpu npu执行入口
├── test_kv_quant_sparse_flash_attention_single.py	# 单用例运行主程序
├── test_kv_quant_sparse_flash_attention_batch.py	# 从 pt 文件批量执行 NPU 测试
└── batch/
    ├── kv_quant_sparse_flash_attention_process.py	# npu接口
    ├── test_kv_quant_sparse_flash_attention_pt_save.py		# 从 Excel 批量生成 pt 文件
    ├── gen_excel_from_paramset.py	# 从 paramset 生成 Excel 文件
    └── excel/
        ├── example.xlsx		# 示例 Excel 用例文件
        └── gen_example_xlsx.py		# 生成示例 Excel 的脚本

使用方法

attention/kv_quant_sparse_flash_attention/test/pytest 目录下执行:

命令格式

bash test_run.sh <模式> [-E excel_path] [-S sheet] [-P path] [-O output_path]

参数选项

选项 说明 适用模式
-E excel_path 指定 Excel 文件路径,默认 ./excel/example.xlsx batch_save
-S sheet 指定 Excel Sheet 页名,默认 Sheet1 batch_save/gen_excel_from_paramset
-P path 指定路径(不同模式含义不同,详见下表) single/batch_save/batch_exec/gen_excel_from_paramset
模式 -P 参数含义 默认值
single paramset 文件名 kv_quant_sparse_flash_attention_paramset
batch_save pt 文件保存路径 ./pt_files/
batch_exec pt 文件执行路径(目录或单个文件) ./pt_files/
gen_excel_from_paramset paramset 文件名 kv_quant_sparse_flash_attention_paramset

gen_excel_from_paramset 模式额外参数:

选项 说明 默认值
-E excel_output 输出 Excel 文件路径 ./excel/example.xlsx
-S sheet Excel Sheet 页名 Sheet1

single

手动配置 kv_quant_sparse_flash_attention_paramset.py 的参数,或使用 -P 指定其他 paramset 文件。

bash test_run.sh single                              # 使用默认 paramset
bash test_run.sh single -P my_paramset                # 使用指定的 paramset 文件

batch_save

从 Excel 读取参数,生成包含 CPU golden 的 .pt 用例文件。

bash test_run.sh batch_save                           # 使用默认 Excel 和 Sheet
bash test_run.sh batch_save -E ./test.xlsx            # 指定 Excel 文件
bash test_run.sh batch_save -E ./test.xlsx -S Sheet1  # 指定 Excel 和 Sheet
bash test_run.sh batch_save -E ./test.xlsx -S Sheet1 -P ./output_pt/  # 指定全部参数
bash test_run.sh batch_save -S Sheet1 -E ./test.xlsx  # 参数顺序可任意

gen_excel_from_paramset

从 paramset 生成 Excel 文件。

bash test_run.sh gen_excel_from_paramset                           # 使用默认 paramset
bash test_run.sh gen_excel_from_paramset -P my_paramset            # 指定 paramset 文件
bash test_run.sh gen_excel_from_paramset -P my_paramset -E ./output/example.xlsx  # 指定输出路径
bash test_run.sh gen_excel_from_paramset -P my_paramset -E ./output/example.xlsx -S decode  # 指定 Sheet 名

batch_exec

.pt 文件批量回放执行 NPU 算子并对比精度。

bash test_run.sh batch_exec                           # 执行默认目录下所有 pt 文件
bash test_run.sh batch_exec -P ./pt_files/test.pt     # 执行单个 pt 文件
bash test_run.sh batch_exec -P ./custom_pt_dir/       # 执行指定目录下所有 pt 文件

下面给一个可直接参考的 Excel 用例,列名需与 batch 框架读取字段保持一致:

Testcase_Prefix Testcase_Number layout_query layout_kv q_type kv_dtype B S1 S2 N1 N2 D K scale_value key_quant_mode value_quant_mode sparse_block_size tile_size rope_head_dim sparse_mode attention_mode quant_scale_repo_mode block_size block_num actual_seq_q actual_seq_kv
tnd_sample 1 TND TND torch.bfloat16 hifloat8 2 8 8 16 1 512 4 0.04166666666666666 2 2 1 128 64 3 2 1 256 [5,8] [6,8]

结果文件

  • result.xlsx:记录每个用例的关键信息、执行状态与 fulfill_percent
  • ./pt_files/*.pt:batch 流程生成的中间测试用例