MindSpeed-LLM/examples/mindspore/qwen25 · Ascend/MindSpeed-LLM - AtomGit

ascend-robot[mindspore][docs][2.2.0]update mindspore docs

5150edbc创建于 2025年10月23日历史提交

文件	最后提交记录	最后更新时间
README.md	[mindspore][docs][2.2.0]update mindspore docs Co-authored-by: ybwang19<1605891897@qq.com> # message auto-generated for no-merge-commit merge: !3569 merge 2.2.0 into 2.2.0 [mindspore][docs][2.2.0]update mindspore docs Created-by: ybwang19 Commit-by: ybwang19 Merged-by: ascend-robot Description: PTA燎原行动-资料整改 See merge request: Ascend/MindSpeed-LLM!3569	7 个月前
ckpt_convert_qwen25_hf2mcore.sh	!3155 [mindspore][master] convert third-party library diff to patch Merge pull request !3155 from 周徐敏/master	9 个月前
ckpt_convert_qwen25_mcore2hf.sh	!3155 [mindspore][master] convert third-party library diff to patch Merge pull request !3155 from 周徐敏/master	9 个月前
data_convert_qwen25_instruction.sh	!2949 [mindspore][master][sh&doc]add finetune data convert Merge pull request !2949 from 孔德硕/add_tun_data_convert_script_master	10 个月前
data_convert_qwen25_pretrain.sh	!2743 support qwen25-7b pretrain, tune ,generate ,evaluate, and pretrain data convert , ckpt convert Merge pull request !2743 from 孔德硕/ms_qwen25s	11 个月前
evaluate_qwen25_32b_ms.sh	!2795 add qwen25_32b pretrain and evaluate Merge pull request !2795 from 孔德硕/qwen25_32b	11 个月前
evaluate_qwen25_7b_ms.sh	[mindspore][docs][2.2.0]update mindspore docs Co-authored-by: ybwang19<1605891897@qq.com> # message auto-generated for no-merge-commit merge: !3569 merge 2.2.0 into 2.2.0 [mindspore][docs][2.2.0]update mindspore docs Created-by: ybwang19 Commit-by: ybwang19 Merged-by: ascend-robot Description: PTA燎原行动-资料整改 See merge request: Ascend/MindSpeed-LLM!3569	7 个月前
generate_qwen25_32b_ms.sh	!3022 [mindspore][bugfix][sh] fix qwen25 generator shell script Merge pull request !3022 from 孔德硕/fix_qwen25_script_master	10 个月前
generate_qwen25_7b_ms.sh	!3022 [mindspore][bugfix][sh] fix qwen25 generator shell script Merge pull request !3022 from 孔德硕/fix_qwen25_script_master	10 个月前
pretrain_qwen25_32b_32k_ms.sh	!2795 add qwen25_32b pretrain and evaluate Merge pull request !2795 from 孔德硕/qwen25_32b	11 个月前
pretrain_qwen25_7b_32k_ms.sh	!2809 update qwen25-7b gbs Merge pull request !2809 from 孔德硕/qwen25_7b_update_gsb	11 个月前
tune_qwen25_32b_4k_full_ms.sh	!2808 adapte qwen25_32b_ms tune and generate Merge pull request !2808 from 森镇/adapt_qwen25_ms_tune_and_generate_2	11 个月前
tune_qwen25_7b_4k_full_ms.sh	!3017 [mindspore][bugfix][sh] fix qwen25_7b tune script Merge pull request !3017 from 孔德硕/fix_tune_qwen25_7b_sh	10 个月前

Mindspore后端提供Qwen25系列模型支持

模型	下载链接	序列	实现	集群	是否支持
Qwen25	7B	4K	Mcore	1x8	✅
	7B	32K	Mcore	1x8	✅
	32B	4K	Mcore	4x8	✅
	32B	32K	Mcore	4x8	✅

MindSpore后端跑通Qwen25模型手把手教程

环境配置

MindSpeed-LLM MindSpore后端的安装步骤参考基础安装指导。

权重转换

权重下载
以7B模型为例，从huggingface下载模型权重和其它配置文件，若需要在开源权重上继续预训练、微调、推理，也请下载网络模型文件。
权重转换
提供脚本将huggingface开源权重转换为mcore权重，用于训练、推理、评估等任务。使用方法如下，请根据实际需要的TP/PP等切分策略和权重路径修改权重转换脚本：
```
cd MindSpeed-LLM
bash examples/mindspore/qwen25/ckpt_convert_qwen25_hf2mcore.sh
```
运行脚本后，预期会看到类似以下的日志输出，表示权重转换成功：
```
successfully saved checkpoint from iteration 1 to ./model_weights/qwen2.5_mcore/
INFO:root:Done!
```

注意：

MindSpore 后端默认在Device侧进行权重转换，在模型较大时存在OOM风险，因此建议用户手动修改convert_ckpt.py，在包导入时加入如下代码设置CPU侧执行权重转换：

import mindspore as ms
ms.set_context(device_target="CPU", pynative_synchronize=True)
import torch
torch.configs.set_pyboost(False)

MindSpore 后端转换出的模型权重无法用于 Torch后端训练或推理。

数据预处理

当前MindSpore后端，已完全支持MindSpeed-LLM的多种任务场景下的数据预处理

预训练

以Alpaca数据集为例，在进行数据预处理时，只需在预训练数据预处理脚本data_convert_qwen25_pretrain.sh中配置好数据输入/输出路径、tokenizer模型路径，并启动即可：

bash examples/mindspore/qwen25/data_convert_qwen25_pretrain.sh

预训练数据集处理结果如下：

./dataset/alpaca_text_document.bin
./dataset/alpaca_text_document.idx

预训练时，数据集路径 --data-path 参数传入 ./dataset/alpaca_text_document 即可

微调

以Alpaca风格微调数据集处理为例，只需在预训练数据预处理脚本data_convert_qwen25_instruction.sh中配置好数据输入/输出路径、tokenizer模型路径，并启动即可：

bash examples/mindspore/qwen25/data_convert_qwen25_instruction.sh

微调数据集处理结果如下：

./finetune_dataset/alpaca_packed_attention_mask_document.bin
./finetune_dataset/alpaca_packed_attention_mask_document.idx
./finetune_dataset/alpaca_packed_input_ids_document.bin
./finetune_dataset/alpaca_packed_input_ids_document.idx
./finetune_dataset/alpaca_packed_labels_document.bin
./finetune_dataset/alpaca_packed_labels_document.idx

微调时，数据集路径输入 ./finetune_dataset/alpaca 即可

训练

预训练

预训练使用方法如下

# 以7b模型为例
cd MindSpeed-LLM
bash examples/mindspore/qwen25/pretrain_qwen25_7b_32k_ms.sh

用户需要根据实际情况修改脚本中的以下变量

变量名	含义
MASTER_ADDR	多机情况下主节点IP
NODE_RANK	多机下，各机对应节点序号
CKPT_SAVE_DIR	训练中权重保存路径
DATA_PATH	数据预处理后的数据路径
TOKENIZER_PATH	qwen25 tokenizer目录
CKPT_LOAD_DIR	权重转换保存的权重路径，用于初始权重加载，如无初始权重则随机初始化

微调

微调和预训练的使用方法类似

# 以全参微调7b模型为例
cd MindSpeed-LLM
bash examples/mindspore/qwen25/tune_qwen25_7b_4k_full_ms.sh

与预训练一样，用户需要根据实际情况修改脚本中的上述变量。

推理

推理使用方法如下

# 以7b模型为例
cd MindSpeed-LLM
bash examples/mindspore/qwen25/generate_qwen25_7b_ms.sh

用户需要根据实际情况修改脚本中以下变量

变量名	含义
MASTER_ADDR	多机情况下主节点IP
NODE_RANK	多机下，各机对应节点序号
CHECKPOINT	训练保存的权重路径
TOKENIZER_PATH	qwen25 tokenizer目录

评估

评估使用方法如下

# 以7b模型为例
cd MindSpeed-LLM
bash examples/mindspore/qwen25/evaluate_qwen25_7b_ms.sh

用户需要根据实际情况修改脚本中以下变量。关于数据集，可参考评估数据集

变量名	含义
MASTER_ADDR	多机情况下主节点IP
NODE_RANK	多机下，各机对应节点序号
TOKENIZER_PATH	qwen25 tokenizer目录
CKPT_LOAD_DIR	权重转换保存的权重路径，或训练保存的权重路径
DATA_PATH	评估采用的数据集路径，当前推荐使用MMLU
TASK	评估采用的数据集，当前推荐使用MMLU

使用MMLU的前3个子集，进行评估的结果如下：

INFO:mindspeed_llm.tasks.evaluation.eval_impl.mmlu_eval:mmlu acc = 321/387=0.8294573643410853
total: 100%|█████████████████████████████████████████████████████| 3/3 [06:16<00:00, 128.12s/it]INFO:main:
             subject   question_n   acc
0   abstract_algebra          100   0.720000
1          astronomy          152   0.927632
2            anatomy          135   0.800000
3              total          387   0.829457
INFO:main:MMLU Running Time:, 376.0990614891052