Skip to main content

基于Kaldi和Vosk的离线开源语音识别API

项目描述

这是 Vosk 的 Python 模块。

Vosk 是一个离线开源语音识别工具包。它支持 20 多种语言和方言的语音识别 - 英语、印度英语、德语、法语、西班牙语、葡萄牙语、汉语、俄语、土耳其语、越南语、意大利语、荷兰语、加泰罗尼亚语、阿拉伯语、希腊语、波斯语、菲律宾语、乌克兰语、哈萨克语、瑞典语、日语、世界语、印地语、捷克语、波兰语。更多即将到来。

Vosk 模型很小 (50 Mb),但提供连续的大词汇量转录、流式 API 的零延迟响应、可重新配置的词汇和说话人识别。

Vosk 为聊天机器人、智能家电、虚拟助手提供语音识别。它还可以为电影创建字幕,为讲座和采访创建字幕。

Vosk 从 Raspberry Pi 或 Android 智能手机等小型设备扩展到大型集群。

# 文档

有关安装说明、示例和文档,请访问 [Vosk 网站]( https://alphacephei.com/vosk )。另请参阅我们在 [Github] ( https://github.com/alphacep/vosk-api ) 上的项目。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

内置发行版

vosk-0.3.44-py3-none-win_amd64.whl (12.2 MB 查看哈希

已上传 py3

vosk-0.3.44-py3-none-win32.whl (8.6 MB 查看哈希

已上传 py3

vosk-0.3.44-py3-none-manylinux2014_aarch64.whl (2.4 MB 查看哈希

已上传 py3

vosk-0.3.44-py3-none-macosx_10_6_universal2.whl (4.7 MB 查看哈希

已上传 py3

vosk-0.3.44-py3-none-linux_armv7l.whl (2.4 MB 查看哈希

已上传 py3