aae9f595创建于 2025年11月26日历史提交

文件	最后提交记录	最后更新时间
README.md	[fix]sensevoice readme fix Co-authored-by: LJ_1998<lijian379@huawei.com>	6 个月前
diff.patch	!7251 fix: 修改patch文件 Merge pull request !7251 from 赵江江Gitee/sensevoice	11 个月前
infer.py	!7092 [feat][ACL_Pytorch]SenseVoice模型适配优化&性能优化 Merge pull request !7092 from 施康/master	1 年前
requirements.txt	!7092 [feat][ACL_Pytorch]SenseVoice模型适配优化&性能优化 Merge pull request !7092 from 施康/master	1 年前

SenseVoice(TorchAir)-推理指导

SenseVoice(TorchAir)-推理指导
概述
推理环境准备
快速上手
- 获取源码
- 模型推理
  - 性能数据

概述

SenseVoice作为一款专注于高精度多语言语音识别的模型，其独特之处在于其广泛的语言覆盖、强大的情感辨识能力以及高效的推理性能。该模型基于超过40万小时的多样化语音数据训练而成，能够支持超过50种语言的识别，展现出卓越的跨语言识别能力。与市场上其他主流模型相比，SenseVoice在识别精度上实现了显著提升，特别是在复杂场景下的表现尤为出色。

版本说明：

url=https://github.com/modelscope/FunASR.git
commit_id=9c67d9b
model_name=SenseVoice

推理环境准备

该模型需要以下插件与驱动
表 1 版本配套表

配套	版本	环境准备指导
固件与驱动	24.0.RC3	Pytorch框架推理环境准备
CANN	8.0.RC3	-
Python	3.8	-
PyTorch	2.1.0	-
Ascend Extension PyTorch	2.1.0.post10	-
说明：Atlas 800I A2请以CANN版本选择实际固件与驱动版本。	\	\

快速上手

获取源码

获取Pytorch源码

git clone https://github.com/modelscope/FunASR.git
cd FunASR
git reset --hard 9c67d9b

安装依赖
```
pip3 install -r ../requirements.txt
```
获取权重数据

获取 https://modelscope.cn/models/iic/SenseVoiceSmall 文件夹，放在FunASR目录下

模型推理

执行patch文件，修改部分源码

git apply ../diff.patch

移动推理py文件到源码目录内

mv ../infer.py ./

执行推理命令

# 指定使用NPU ID，默认为0
export ASCEND_RT_VISIBLE_DEVICES=0
python3 infer.py --model_path=SenseVoiceSmall --input="./SenseVoiceSmall/example/zh.mp3" --loop=20

参数说明
model_path: 模型权重路径
input: 输入mp3格式语音文件，这里以权重文件内的样例为例
loop：性能测试，循环次数

推理执行完成后，会打屏语音文本的输出，和性能指标rts(处理1s语音需要的时间)

性能数据

推理性能以'SenseVoiceSmall/example/zh.mp3'的中文语音为例

模型	芯片	rts(ms)
sensevoice	800I A2	16