时间频谱图反演
项目描述
tifresi:时间频谱图反演
'tifresi' 发音为'tifreeezy' 提供了适用于反演的TF 和spectrogam 的简单实现,即具有高质量的相位恢复。使用的相位恢复算法是 PGHI(相位梯度堆积分)。
安装
此存储库使用需要安装一些库的 ltfatpy 包。该软件包依赖于一些必须事先安装的库。
- 安装
fftw3
,lapack
和cmake
- 在基于 debian 的 unix 系统上:
sudo apt-get install libfftw3-dev liblapack-dev cmake
- 在 MacOS X 上使用自制软件:
brew install fftw lapack cmake
- 在 MacOS X 上使用端口:
sudo port install fftw-3 fftw-3-single lapack cmake
- 安装 cython(安装 ltfatpy 所需):
pip install cython
- 从 pypi 安装包
pip install tifresi
或从源头
git clone https://github.com/andimarafioti/tifresi cd tifresi pip install .
开始
安装需求后,您可以检查以下笔记本:
demo.ipynb
说明如何构建频谱图并将其反转。demo-mel.ipynb
说明如何使用此存储库中使用的设置计算 mel 频谱图。
许可和引用
此存储库的内容是根据MIT 许可条款发布的。如果您使用它,请考虑引用我们的论文。
@inproceedings{marafioti2019adversarial,
title={Adversarial Generation of Time-Frequency Features with application in audio synthesis},
author={Marafioti, Andr{\'e}s and Perraudin, Nathana{\"e}l and Holighaus, Nicki and Majdak, Piotr},
booktitle={International Conference on Machine Learning},
pages={4352--4362},
year={2019}
}
@article{pruuvsa2017noniterative,
title={A noniterative method for reconstruction of phase from STFT magnitude},
author={Pr{\uu}{\v{s}}a, Zden{\v{e}}k and Balazs, Peter and S{\o}ndergaard, Peter Lempel},
journal={IEEE/ACM Transactions on Audio, Speech, and Language Processing},
volume={25},
number={5},
pages={1154--1164},
year={2017},
publisher={IEEE}
}
发展
作为开发人员,您可以使用以下方法测试包pytest
:
pip install pytest
然后使用运行测试
pytest tifresi
您还可以使用源代码检查器flake8
:
pip install flake8
然后使用运行测试
flake8 .
去做
- 改进文档
- 将文档放在 readthedoc 或类似的东西上
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
tifresi-0.1.4.tar.gz
(15.5 kB
查看哈希)
内置分布
tifresi-0.1.4-py3-none-any.whl
(19.6 kB
查看哈希)