基于大量中文MRC数据训练的roberta_wwm_ext_large模型,在阅读理解、分类等任务上表现优异,助力用户在比赛中取得佳绩。【此简介由AI生成】
以下内容由 AI 翻译,如有问题请 点此提交 issue 反馈
language:
- zh license: "apache-2.0"
Chinese MRC roberta_wwm_ext_large
- 基于海量中文机器阅读理解数据训练的roberta_wwm_ext_large模型,技术细节详见:https://github.com/basketballandlearn/MRC_Competition_Dureader
- 本仓库发布的再训练模型在阅读理解与文本分类等任务中均实现显著性能提升
(已有多个团队基于本模型在Dureader-2021等赛事中斩获前五强佳绩😁)
| 模型/数据集 | Dureader-2021 | 腾讯医疗评测集 |
|---|---|---|
| F1值 | 准确率 | |
| 开发集/A榜 | 测试集-1 | |
| macbert-large (哈工大预训练语言模型) | 65.49 / 64.27 | 82.5 |
| roberta-wwm-ext-large (哈工大预训练语言模型) | 65.49 / 64.27 | 82.5 |
| macbert-large (本团队) | 70.45 / 68.13 | 83.4 |
| roberta-wwm-ext-large (本团队) | 68.91 / 66.91 | 83.1 |