wav2vec2-base-sv-voxpopuli-v2:瑞典语语音预训练模型,基于VoxPopuli语料库

Facebook的Wav2Vec2基础模型,仅在瑞典语上预训练,使用VoxPopuli语料库16.3k无标签数据,采样率16kHz,需创建分词器并微调以用于语音识别。【此简介由AI生成】

分支1Tags0
PPatrick von Platenadd readme
36445212创建于 2022年2月27日6次提交

language: sv tags:

  • audio
  • automatic-speech-recognition
  • voxpopuli-v2 datasets:
  • voxpopuli license: cc-by-nc-4.0 inference: false

Wav2Vec2-base-VoxPopuli-V2

Facebook的Wav2Vec2基础模型,仅基于瑞典语(sv) 并使用VoxPopuli语料库16.3千小时的无标注数据进行预训练。

该模型采用16kHz采样的语音音频进行预训练。使用模型时,请确保输入的语音数据同样以16kHz频率采样。

注意:本模型未配备分词器,因其仅通过音频进行预训练。若要将该模型用于语音识别任务,需创建分词器并基于瑞典语(sv) 的标注文本数据进行微调。详细微调方法可参阅这篇技术博客获取进阶说明。

论文VoxPopuli:用于表示学习、半监督学习与可解释性研究的大规模多语言语音语料库

作者Changhan Wang, Morgane Riviere, Ann Lee, Anne Wu, Chaitanya Talnikar, Daniel Haziza, Mary Williamson, Juan Pino, Emmanuel Dupoux(来自Facebook AI

更多信息请访问官方网站此处

项目介绍

Facebook的Wav2Vec2基础模型,仅在瑞典语上预训练,使用VoxPopuli语料库16.3k无标签数据,采样率16kHz,需创建分词器并微调以用于语音识别。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新