基于Kaldi和Vosk的离线开源语音识别API
项目描述
这是 Vosk 的 Python 模块。
Vosk 是一个离线开源语音识别工具包。它支持 20 多种语言和方言的语音识别 - 英语、印度英语、德语、法语、西班牙语、葡萄牙语、汉语、俄语、土耳其语、越南语、意大利语、荷兰语、加泰罗尼亚语、阿拉伯语、希腊语、波斯语、菲律宾语、乌克兰语、哈萨克语、瑞典语、日语、世界语、印地语、捷克语、波兰语。更多即将到来。
Vosk 模型很小 (50 Mb),但提供连续的大词汇量转录、流式 API 的零延迟响应、可重新配置的词汇和说话人识别。
Vosk 为聊天机器人、智能家电、虚拟助手提供语音识别。它还可以为电影创建字幕,为讲座和采访创建字幕。
Vosk 从 Raspberry Pi 或 Android 智能手机等小型设备扩展到大型集群。
# 文档
有关安装说明、示例和文档,请访问 [Vosk 网站]( https://alphacephei.com/vosk )。另请参阅我们在 [Github] ( https://github.com/alphacep/vosk-api ) 上的项目。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
内置发行版
vosk-0.3.44-py3-none-win_amd64.whl
(12.2 MB
查看哈希)
vosk-0.3.44-py3-none-win32.whl
(8.6 MB
查看哈希)
关
vosk -0.3.44-py3-none-manylinux_2_12_x86_64.manylinux2010_x86_64.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 2652ef213c4c7807dc40af1e7aa578dcccfc4dc4192822a26bc45a9591bcbf76 |
|
MD5 | 7965d1334510307f7b6ffcc25901eb9c |
|
布莱克2-256 | 26c7ed8a6ee755e18708770335a6d38b1e86f4838cdeaa85e92748a4e7431816 |