Star
179
Fork
222
代码
介绍
代码
Issues
49
Pull Requests
55
流水线
Actions
讨论
Wiki
项目成员
54
分析
项目设置
Star
179
Fork
222
master
MindSpeed-LLM
/
tests
/
tools
/
fsdp2
下载当前目录
ascend-robot
chore(fsdp2): develop longcat-flash-lite model in fsdp2
518f5f29
创建于
9 天前
历史提交
文件
最后提交记录
最后更新时间
longcat_flash_lite_moe_hf_weight_convert.py
chore(fsdp2): develop longcat-flash-lite model in fsdp2
9 天前
longcat_flash_lite_moe_hf_weight_convert.sh
chore(fsdp2): develop longcat-flash-lite model in fsdp2
9 天前
moe_hf_param_merge_experts.py
[pytorch][bugfix]delete configuration.json merge
3 个月前
moe_hf_param_merge_experts.sh
[pytorch][feature]integrate moe merge process into FSDP2 training
3 个月前