文件最后提交记录最后更新时间
!2202 新增bbh cot评估模版 & bbh评估支持DP1 年前
!1998 rename: repo package name from modellink to mindspeed_llm 1 年前
!2207 新增agi模版 & agi推理支持DP1 年前
!2207 新增agi模版 & agi推理支持DP1 年前
!2182 boolq新增模版 & boolq支持DP评估1 年前
!2683 Refine scripts and evaluation code1 年前
!2182 boolq新增模版 & boolq支持DP评估1 年前
!2201 新增gsm8k评估模板 & gsm8k支持DP1 年前
!2243 新增hellaswag评估1 年前
!2244 Human_eval评估支持新模版和评估方式1 年前
!2182 boolq新增模版 & boolq支持DP评估1 年前
!2180 mmlu支持ppl评估1 年前
!2463 完成evaluation coverage构建;初步needlebench重构1 年前
!2463 完成evaluation coverage构建;初步needlebench重构1 年前
!2202 新增bbh cot评估模版 & bbh评估支持DP1 年前