Skip to main content

时间频谱图反演

项目描述

tifresi:时间频谱图反演

'tifresi' 发音为'tifreeezy' 提供了适用于反演的TF 和spectrogam 的简单实现,即具有高质量的相位恢复。使用的相位恢复算法是 PGHI(相位梯度堆积分)。

安装

此存储库使用需要安装一些库的 ltfatpy 包。该软件包依赖于一些必须事先安装的库。

  1. 安装fftw3lapackcmake
    • 在基于 debian 的 unix 系统上:
    sudo apt-get install libfftw3-dev liblapack-dev cmake
    
    • 在 MacOS X 上使用自制软件:
    brew install fftw lapack cmake
    
    • 在 MacOS X 上使用端口:
    sudo port install fftw-3 fftw-3-single lapack cmake
    
  2. 安装 cython(安装 ltfatpy 所需):
    pip install cython
    
  3. 从 pypi 安装包
    pip install tifresi
    

或从源头 git clone https://github.com/andimarafioti/tifresi cd tifresi pip install .

开始

安装需求后,您可以检查以下笔记本:

  • demo.ipynb说明如何构建频谱图并将其反转。
  • demo-mel.ipynb说明如何使用此存储库中使用的设置计算 mel 频谱图。

许可和引用

此存储库的内容是根据MIT 许可条款发布的。如果您使用它,请考虑引用我们的论文。

@inproceedings{marafioti2019adversarial,
  title={Adversarial Generation of Time-Frequency Features with application in audio synthesis},
  author={Marafioti, Andr{\'e}s and Perraudin, Nathana{\"e}l and Holighaus, Nicki and Majdak, Piotr},
  booktitle={International Conference on Machine Learning},
  pages={4352--4362},
  year={2019}
}
@article{pruuvsa2017noniterative,
  title={A noniterative method for reconstruction of phase from STFT magnitude},
  author={Pr{\uu}{\v{s}}a, Zden{\v{e}}k and Balazs, Peter and S{\o}ndergaard, Peter Lempel},
  journal={IEEE/ACM Transactions on Audio, Speech, and Language Processing},
  volume={25},
  number={5},
  pages={1154--1164},
  year={2017},
  publisher={IEEE}
}

发展

作为开发人员,您可以使用以下方法测试包pytest

pip install pytest

然后使用运行测试

pytest tifresi

您还可以使用源代码检查器flake8

pip install flake8

然后使用运行测试

flake8 .

去做

  • 改进文档
  • 将文档放在 readthedoc 或类似的东西上

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

tifresi-0.1.4.tar.gz (15.5 kB 查看哈希

已上传 source

内置分布

tifresi-0.1.4-py3-none-any.whl (19.6 kB 查看哈希

已上传 py3