VoxForge 数据库子集上的说话人验证协议
项目描述
Voxforge提供了一系列转录语音,可与免费和开源语音识别引擎一起使用。在这个包中,我们设计了一个说话人识别协议,它使用属于随机选择的30 个说话人的一小部分英语音频文件(只有 6561 个文件)。该子集分为三个等效部分:训练(10 位演讲者)、开发(10 位演讲者)和测试(10 位演讲者)集。
在测试xbob.spkrec时,此包用作说话人识别数据库的玩具示例。
xbob.spkrec 是在 Idiap 参与NIST SRE 2012 评估期间开发的。如果您使用此软件包和/或其结果,请引用以下出版物:
在 NIST SRE 2012 研讨会上发表的原始论文:
@inproceedings{Khoury_NISTSRE_2012, author = {Khoury, Elie and El Shafey, Laurent and Marcel, S{\'{e}}bastien}, month = {dec}, title = {The Idiap Speaker Recognition Evaluation System at NIST SRE 2012}, booktitle = {NIST Speaker Recognition Conference}, year = {2012}, location = {Orlando, USA}, organization = {NIST}, pdf = {http://publications.idiap.ch/downloads/papers/2012/Khoury_NISTSRE_2012.pdf} }
Bob 作为用于运行实验的核心框架:
@inproceedings{Anjos_ACMMM_2012, author = {A. Anjos and L. El Shafey and R. Wallace and M. G\"unther and C. McCool and S. Marcel}, title = {Bob: a free signal processing and machine learning toolbox for researchers}, year = {2012}, month = oct, booktitle = {20th ACM Conference on Multimedia Systems (ACMMM), Nara, Japan}, publisher = {ACM Press}, url = {http://publications.idiap.ch/downloads/papers/2012/Anjos_Bob_ACMMM12.pdf}, }
安装
只需下载此包并在本地解压即可:
$ wget http://pypi.python.org/packages/source/x/xbob.db.voxforge/xbob.db.voxforge-0.0.1a2.zip $ unzip xbob.db.voxforge-0.0.1a2.zip $ cd xbob.db.voxforge-0.0.1a2
使用 buildout 引导并为实验准备好工作环境:
$ python bootstrap $ ./bin/buildout
这也需要安装 bob (>= 1.2.0)。
获取数据
可以从其原始 URL(在 Voxforge 上)下载数据,并通过运行将存储数据的路径作为输入的download_and_untar.sh来提取数据:
$ ./download_and_untar.sh PATH/TO/WAV/DIRECTORY
如果您需要帮助,请联系我们。
项目详情
关
xbob.db.voxforge-0.1.0.zip的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | cf208e59a0a1cc9b504b7d74240b2732f4532a016c048ce3c732842f9424e20a |
|
MD5 | b375e30d836d1897217c8d5d87745bde |
|
布莱克2-256 | 4cf4c254ef125867d8946ecc5b62e328b0a15817886820f4637ede6fdc62959a |