Star
180
Fork
224
代码
介绍
代码
Issues
55
Pull Requests
53
流水线
Actions
讨论
Wiki
项目成员
54
分析
项目设置
Star
180
Fork
224
2.2.0
MindSpeed-LLM
/
mindspeed_llm
/
tasks
/
evaluation
/
eval_impl
下载当前目录
I
i-robot
!2683
Refine scripts and evaluation code
cab023b2
创建于
2025年5月22日
历史提交
文件
最后提交记录
最后更新时间
fewshot_template
!2202
新增bbh cot评估模版 & bbh评估支持DP
1 年前
__init__.py
!1998
rename: repo package name from modellink to mindspeed_llm
1 年前
agi_eval.py
!2207
新增agi模版 & agi推理支持DP
1 年前
bbh_eval.py
!2207
新增agi模版 & agi推理支持DP
1 年前
boolq_eval.py
!2182
boolq新增模版 & boolq支持DP评估
1 年前
ceval_exam.py
!2683
Refine scripts and evaluation code
1 年前
cmmlu_eval.py
!2182
boolq新增模版 & boolq支持DP评估
1 年前
gsm8k_eval.py
!2201
新增gsm8k评估模板 & gsm8k支持DP
1 年前
hellaswag_eval.py
!2243
新增hellaswag评估
1 年前
human_eval.py
!2244
Human_eval评估支持新模版和评估方式
1 年前
mmlu_eval.py
!2182
boolq新增模版 & boolq支持DP评估
1 年前
mmlu_ppl.py
!2180
mmlu支持ppl评估
1 年前
needlebench_eval.py
!2463
完成evaluation coverage构建;初步needlebench重构
1 年前
needlebench_single.py
!2463
完成evaluation coverage构建;初步needlebench重构
1 年前
template.py
!2202
新增bbh cot评估模版 & bbh评估支持DP
1 年前