文件最后提交记录最后更新时间
20 小时前
4 天前
2 个月前
README.md

PyPTO-Gym Tests

本目录是 pypto-gym 的测试目录,与 src/pypto_gym/ops/pypto_tensor/ 下的算子实现一一对应,例如:

Kernel 实现 对应测试
src/pypto_gym/ops/pypto_tensor/arctic/sum_lstm.py ops/arctic/test_sum_lstm.py
src/pypto_gym/ops/pypto_tensor/qat/qat_impl.py ops/qat/test_qat.py
src/pypto_gym/ops/pypto_tensor/glm_v4_5/glm_*_impl.py ops/glm_v4_5/test_glm_*.py
src/pypto_gym/ops/pypto_tensor/deepseek_v32_exp/*_impl.py ops/deepseek_v32_exp/test_*.py
src/pypto_gym/ops/pypto_tensor/qwen3_1_7b/qwen3_*.py ops/qwen3_1_7b/test_*.py
src/pypto_gym/ops/pypto_tensor/qwen3_next/gated_delta_rule_impl.py ops/qwen3_next/test_gated_delta_rule.py

运行方式

# 运行指定模型的所有算子
pytest tests/ops/arctic -v --forked

# 运行单个算子用例文件
pytest tests/ops/glm_v4_5/test_glm_gate.py -v

# 指定 NPU 设备
pytest tests/ops/arctic -v --forked --device 0

# 运行 experimental 目录下的算子(需显式指定路径)
pytest src/pypto_gym/ops/experimental/matmul -v --forked

标记(markers)

  • @pytest.mark.soc("950", "910") — 指定 SoC 版本。未标注等同于 "910"
  • @pytest.mark.world_size(N) — 指定所需 NPU 卡数,默认 1。

SoC 筛选、耗时估计重排序等调度逻辑定义在顶层的 conftest.py

添加新测试

参考 README 的 "添加新算子" 小节