chinese_pretrain_mrc_roberta_wwm_ext_large:中文MRC再训练模型,提升阅读理解与分类任务性能

基于大量中文MRC数据训练的roberta_wwm_ext_large模型,在阅读理解、分类等任务上表现优异,助力用户在比赛中取得佳绩。【此简介由AI生成】

分支1Tags0

language:

  • zh license: "apache-2.0"

Chinese MRC roberta_wwm_ext_large

  • 基于海量中文机器阅读理解数据训练的roberta_wwm_ext_large模型,技术细节详见:https://github.com/basketballandlearn/MRC_Competition_Dureader
  • 本仓库发布的再训练模型在阅读理解与文本分类等任务中均实现显著性能提升
    (已有多个团队基于本模型在Dureader-2021等赛事中斩获前五强佳绩😁)
模型/数据集 Dureader-2021 腾讯医疗评测集
F1值 准确率
开发集/A榜 测试集-1
macbert-large (哈工大预训练语言模型) 65.49 / 64.27 82.5
roberta-wwm-ext-large (哈工大预训练语言模型) 65.49 / 64.27 82.5
macbert-large (本团队) 70.45 / 68.13 83.4
roberta-wwm-ext-large (本团队) 68.91 / 66.91 83.1

项目介绍

基于大量中文MRC数据训练的roberta_wwm_ext_large模型,在阅读理解、分类等任务上表现优异,助力用户在比赛中取得佳绩。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新