Skip to main content

VoxForge 数据库子集上的说话人验证协议

项目描述

Voxforge提供了一系列转录语音,可与免费开源语音识别引擎一起使用。在这个包中,我们设计了一个说话人识别协议,它使用属于随机选择的30 个说话人的一小部分英语音频文件(只有 6561 个文件)。该子集分为三个等效部分:训练(10 位演讲者)、开发(10 位演讲者)和测试(10 位演讲者)集。

在测试xbob.spkrec时,此包用作说话人识别数据库的玩具示例。

xbob.spkrec 是在 Idiap 参与NIST SRE 2012 评估期间开发的。如果您使用此软件包和/或其结果,请引用以下出版物:

  1. 在 NIST SRE 2012 研讨会上发表的原始论文:

     @inproceedings{Khoury_NISTSRE_2012,
       author = {Khoury, Elie and El Shafey, Laurent and Marcel, S{\'{e}}bastien},
       month = {dec},
       title = {The Idiap Speaker Recognition Evaluation System at NIST SRE 2012},
       booktitle = {NIST Speaker Recognition Conference},
       year = {2012},
       location = {Orlando, USA},
       organization = {NIST},
       pdf = {http://publications.idiap.ch/downloads/papers/2012/Khoury_NISTSRE_2012.pdf}
    }
  2. Bob 作为用于运行实验的核心框架:

    @inproceedings{Anjos_ACMMM_2012,
      author = {A. Anjos and L. El Shafey and R. Wallace and M. G\"unther and C. McCool and S. Marcel},
      title = {Bob: a free signal processing and machine learning toolbox for researchers},
      year = {2012},
      month = oct,
      booktitle = {20th ACM Conference on Multimedia Systems (ACMMM), Nara, Japan},
      publisher = {ACM Press},
      url = {http://publications.idiap.ch/downloads/papers/2012/Anjos_Bob_ACMMM12.pdf},
    }

安装

只需下载此包并在本地解压即可:

$ wget http://pypi.python.org/packages/source/x/xbob.db.voxforge/xbob.db.voxforge-0.0.1a2.zip
$ unzip xbob.db.voxforge-0.0.1a2.zip
$ cd xbob.db.voxforge-0.0.1a2

使用 buildout 引导并为实验准备好工作环境:

$ python bootstrap
$ ./bin/buildout

这也需要安装 bob (>= 1.2.0)。

获取数据

可以从其原始 URL(在 Voxforge 上)下载数据,并通过运行将存储数据的路径作为输入的download_and_untar.sh来提取数据:

$ ./download_and_untar.sh PATH/TO/WAV/DIRECTORY

如果您需要帮助,请联系我们。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

xbob.db.voxforge-0.1.0.zip (85.1 kB 查看哈希

已上传 source