| 更新Muon优化器测试基线数据
- 更新BASELINE_LOSSES_NESTEROV_TRUE基线数据
- 更新BASELINE_LOSSES_NESTEROV_FALSE基线数据
- 更新BASELINE_LOSSES_DIFF_LR基线数据
- 所有测试用例已通过验证
【master】【bugfix】generator pybind changes seed and offset from parameter into tensor
fix dropout shard
fix dropout shard
fix dropout shard
| 4 个月前 |
| add adamw st
| 1 年前 |
| test: add unit tests for Muon optimizer initialization and computation
test: add baseline data and comparison for Muon optimizer losses
| 5 个月前 |
| 增加adamw.py测试用例
| 5 个月前 |
| 增加FusedAdamW
| 1 年前 |