Facebook的Wav2Vec2基础模型，仅在瑞典语上预训练，使用VoxPopuli语料库16.3k无标签数据，采样率16kHz，需创建分词器并微调以用于语音识别。【此简介由AI生成】

PPatrick von Platenadd readme

36445212创建于 2022年2月27日6次提交

文件	最后提交记录	最后更新时间
.gitattributes	initial commit	4 年前
README.md	add readme	4 年前
config.json	add model	4 年前
preprocessor_config.json	add model	4 年前
pytorch_model.binLFS	add model	4 年前

自动翻译

language: sv tags:

audio
automatic-speech-recognition
voxpopuli-v2 datasets:
voxpopuli license: cc-by-nc-4.0 inference: false

Wav2Vec2-base-VoxPopuli-V2

Facebook的Wav2Vec2基础模型，仅基于瑞典语（sv） 并使用VoxPopuli语料库中16.3千小时的无标注数据进行预训练。

该模型采用16kHz采样的语音音频进行预训练。使用模型时，请确保输入的语音数据同样以16kHz频率采样。

注意：本模型未配备分词器，因其仅通过音频进行预训练。若要将该模型用于语音识别任务，需创建分词器并基于瑞典语（sv） 的标注文本数据进行微调。详细微调方法可参阅这篇技术博客获取进阶说明。

论文：VoxPopuli：用于表示学习、半监督学习与可解释性研究的大规模多语言语音语料库

作者：Changhan Wang, Morgane Riviere, Ann Lee, Anne Wu, Chaitanya Talnikar, Daniel Haziza, Mary Williamson, Juan Pino, Emmanuel Dupoux（来自Facebook AI）

更多信息请访问官方网站此处。

项目介绍

下载使用量

项目总下载次数（含Clone、Pull、 zip 包及 release 下载），每日凌晨更新

wav2vec2-base-sv-voxpopuli-v2:瑞典语语音预训练模型，基于VoxPopuli语料库

Wav2Vec2-base-VoxPopuli-V2

项目介绍

下载使用量

目录