MindSpeed-RL/configs/datasets/math_17k.yaml-代码预览-MindSpeed-RL:基于昇腾生态的强化学习加速框架项目 - AtomGit

9cd31990创建于 2025年11月6日历史提交

input: ./dataset/dapo-math-17k.parquet
tokenizer_name_or_path: ./model_from_hf/qwen25-7b
output_prefix: ./dataset/data
handler_name: Math17kAlpacaStyleInstructionHandler
tokenizer_type: HuggingFaceTokenizer
workers: 8
log_interval: 1000
prompt_type: empty
dataset_additional_keys: [labels]
map_keys:  {"prompt":"prompt", "query":"", "response": "reward_model", "system":""}