# 最终结果汇总(提交前)

1. 最终采用实验

  • 运行标签:final_h128_e50
  • 配置:hidden_dim=128lr=1e-3batch_size=16epochs=50

2. 核心评测指标

来源文件:outputs/metrics/model_eval_final_h128_e50.json

指标 数值
model_mse_mean 3888.2149827745225
physics_mse_mean 6177.675905863444
improvement_pct_vs_physics 37.06023038398495%
samples 18

3. 推理时延(CPU)

测试条件:batch=1seq_len=21

指标 数值
mean 1.5691 ms
p50 1.5029 ms
p95 2.1840 ms
p99 2.7352 ms

4. 阶段进展

从 30 轮到 50 轮长训:

  • 30 轮提升:31.78%
  • 50 轮提升:37.06%
  • 绝对增益:+5.28%

5. 消融对比(20 轮)

运行标签 参数 Model MSE Physics MSE 提升幅度 平均时延
exp_h64_lr1e3 hidden=64, lr=1e-3 4671.8231 6177.6759 24.38% 2.1063 ms
exp_h128_lr1e3 hidden=128, lr=1e-3 4195.1429 6177.6759 32.09% 2.5771 ms
exp_h64_lr5e4 hidden=64, lr=5e-4 5474.8579 6177.6759 11.38% 1.8399 ms

6. 提交证据文件

  • 最终评估:outputs/metrics/model_eval_final_h128_e50.json
  • 历次评估:
    • outputs/metrics/model_eval_exp_h64_lr1e3.json
    • outputs/metrics/model_eval_exp_h128_lr1e3.json
    • outputs/metrics/model_eval_exp_h64_lr5e4.json
  • 基线报告:outputs/metrics/submission_report.md
  • 最终权重:checkpoints/final_h128_e50/best_model.pt