webrtcvad - Google WebRTC 语音活动检测器 (VAD) 的 Python 接口

Google WebRTC 语音活动检测器 (VAD) 的 Python 接口

项目描述

py-webrtcvad

这是 WebRTC 语音活动检测器 (VAD) 的 python 接口。它与 Python 2 和 Python 3 兼容。

VAD将一段音频数据分类为有声或无声。它可用于电话和语音识别。

据报道，谷歌为WebRTC 项目开发的 VAD 是最好的可用 VAD 之一，它快速、现代且免费。

如何使用它

安装 webrtcvad 模块：
```
pip install webrtcvad
```
创建一个Vad对象：
```
import webrtcvad
vad = webrtcvad.Vad()
```
可选地，设置它的积极模式，它是一个介于 0 和 3 之间的整数。0 是最不积极的过滤非语音，3 是最积极的。（您也可以在创建 VAD 时设置模式，例如vad = webrtcvad.Vad(3)）：
```
vad.set_mode(1)
```

给它一小段音频（“帧”）。WebRTC VAD 仅接受 16 位单声道 PCM 音频，采样频率为 8000、16000 或 32000 Hz。帧的持续时间必须为 10、20 或 30 毫秒：

# Run the VAD on 10 ms of silence. The result should be False.
sample_rate = 16000
frame_duration = 10  # ms
frame = b'\x00\x00' * (sample_rate * frame_duration / 1000)
print 'Contains speech: %s' % (vad.is_speech(frame, sample_rate)

有关将处理 .wav 文件、查找浊音段并将每个段写入单独的 .wav 的更详细示例，请参见example.py 。

如何运行单元测试

运行单元测试：

pip install -e ".[dev]"
python setup.py test

项目详情

发布历史发布通知| RSS订阅

这个版本

2.0.10

2017 年 1 月 7 日

2.0.9

2016 年 12 月 16 日

2.0.8

2016 年 6 月 19 日

2.0.7

2016 年 4 月 27 日

1.0.7

2016 年 4 月 24 日

1.0.6

2016 年 4 月 24 日

1.0.5

2016 年 4 月 24 日

1.0.4

2016 年 4 月 24 日

1.0.3

2016 年 4 月 24 日

1.0.2

2016 年 4 月 24 日

1.0.1

2016 年 4 月 24 日

1.0

2016 年 4 月 24 日

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个，请了解有关安装包的更多信息。

源分布

webrtcvad-2.0.10.tar.gz （66.2 kB 查看哈希）

已上传 2017 年 1 月 7 日 source

webrtcvad -2.0.10.tar.gz 的哈希值

webrtcvad-2.0.10.tar.gz 的哈希值
算法	哈希摘要
SHA256	`f1bed2fb25b63fb7b1a55d64090c993c9c9167b28485ae0bcdd81cf6ede96aea`
MD5	`213d2848aeebbbd22485d4ad630b5fdb`
布莱克2-256	`8934e2de2d97f3288512b9ea56f92e7452f8207eb5a0096500badf9dfd48f5e6`

webrtcvad 2.0.10

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

py-webrtcvad

如何使用它

如何运行单元测试

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史发布通知| RSS订阅

下载文件

源分布

webrtcvad 2.0.10

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

py-webrtcvad

如何使用它

如何运行单元测试

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史 发布通知| RSS订阅

下载文件

源分布

发布历史发布通知| RSS订阅