# 最终结果汇总(提交前)
1. 最终采用实验
- 运行标签:
final_h128_e50 - 配置:
hidden_dim=128,lr=1e-3,batch_size=16,epochs=50
2. 核心评测指标
来源文件:outputs/metrics/model_eval_final_h128_e50.json
| 指标 | 数值 |
|---|---|
| model_mse_mean | 3888.2149827745225 |
| physics_mse_mean | 6177.675905863444 |
| improvement_pct_vs_physics | 37.06023038398495% |
| samples | 18 |
3. 推理时延(CPU)
测试条件:batch=1,seq_len=21
| 指标 | 数值 |
|---|---|
| mean | 1.5691 ms |
| p50 | 1.5029 ms |
| p95 | 2.1840 ms |
| p99 | 2.7352 ms |
4. 阶段进展
从 30 轮到 50 轮长训:
- 30 轮提升:31.78%
- 50 轮提升:37.06%
- 绝对增益:+5.28%
5. 消融对比(20 轮)
| 运行标签 | 参数 | Model MSE | Physics MSE | 提升幅度 | 平均时延 |
|---|---|---|---|---|---|
exp_h64_lr1e3 |
hidden=64, lr=1e-3 | 4671.8231 | 6177.6759 | 24.38% | 2.1063 ms |
exp_h128_lr1e3 |
hidden=128, lr=1e-3 | 4195.1429 | 6177.6759 | 32.09% | 2.5771 ms |
exp_h64_lr5e4 |
hidden=64, lr=5e-4 | 5474.8579 | 6177.6759 | 11.38% | 1.8399 ms |
6. 提交证据文件
- 最终评估:
outputs/metrics/model_eval_final_h128_e50.json - 历次评估:
outputs/metrics/model_eval_exp_h64_lr1e3.jsonoutputs/metrics/model_eval_exp_h128_lr1e3.jsonoutputs/metrics/model_eval_exp_h64_lr5e4.json
- 基线报告:
outputs/metrics/submission_report.md - 最终权重:
checkpoints/final_h128_e50/best_model.pt