panns_inference：音频标记和声音事件检测推理工具箱

项目描述

PANN 推断

panns_inference为音频标记和声音事件检测提供了一个易于使用的 Python 接口。音频标记和声音事件检测模型从 PANN 训练：用于音频模式识别的大规模预训练音频神经网络：https ://github.com/qiuqiangkong/audioset_tagging_cnn

安装

PyTorch>=1.0 是必需的。

$ pip install panns-inference

用法

$ python3 example.py

例如：

import librosa
import panns_inference
from panns_inference import AudioTagging, SoundEventDetection, labels

audio_path = 'examples/R9_ZSCveAHg_7s.wav'
(audio, _) = librosa.core.load(audio_path, sr=32000, mono=True)
audio = audio[None, :]  # (batch_size, segment_samples)

print('------ Audio tagging ------')
at = AudioTagging(checkpoint_path=None, device='cuda')
(clipwise_output, embedding) = at.inference(audio)

print('------ Sound event detection ------')
sed = SoundEventDetection(checkpoint_path=None, device='cuda')
framewise_output = sed.inference(audio)

结果

------ Audio tagging ------
Checkpoint path: /root/panns_data/Cnn14_mAP=0.431.pth
GPU number: 1
Speech: 0.893
Telephone bell ringing: 0.754
Inside, small room: 0.235
Telephone: 0.183
Music: 0.092
Ringtone: 0.047
Inside, large room or hall: 0.028
Alarm: 0.014
Animal: 0.009
Vehicle: 0.008
------ Sound event detection ------
Checkpoint path: /root/panns_data/Cnn14_mAP=0.431.pth
GPU number: 1
Save fig to results/sed_result.pdf

声音事件检测图：

引用

[1] Kong, Qiuqiang, Yin Cao, Turab Iqbal, Yuxuan Wang, Wenwu Wang, and Mark D. Plumbley。“PANN：用于音频模式识别的大规模预训练音频神经网络。” arXiv 预印本 arXiv:1912.10211 (2019)。

项目详情

发布历史发布通知| RSS订阅

这个版本

0.0.7

2020 年 8 月 17 日

0.0.6

2020 年 5 月 1 日

0.0.5

2020 年 5 月 1 日

0.0.4

2020 年 4 月 30 日

0.0.3

2020 年 4 月 14 日

0.0.2

2020 年 3 月 8 日

0.0.1

2020 年 3 月 8 日

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个，请了解有关安装包的更多信息。

源分布

panns-inference-0.0.7.tar.gz （6.7 kB 查看哈希）

已上传 2020 年 8 月 17 日 source

内置分布

panns_inference-0.0.7-py3-none-any.whl （7.9 kB 查看哈希）

已上传 2020 年 8 月 17 日 py3

panns -inference-0.0.7.tar.gz 的哈希值

panns-inference-0.0.7.tar.gz 的哈希值
算法	哈希摘要
SHA256	`17810f95df074a762081407a1a29b8778a1df19b82928c48b6e75f51f55abade`
MD5	`bb1ec893556a9cf544fe3f9741104a0f`
布莱克2-256	`304251b9988e51d186b501c166c9ef4b0680ad6ccea9aa8406caa62ac6cb94ca`

panns_inference -0.0.7-py3-none-any.whl 的哈希值

panns_inference-0.0.7-py3-none-any.whl 的哈希值
算法	哈希摘要
SHA256	`74a527c83d285a3885dcf892d61bb20f82b15217dca8932933a9753d371cc347`
MD5	`0e77f2fbcdf632409c2e09ce37f89f55`
布莱克2-256	`36dd2a540d0a8c1300fa0e30f2655b4a17cb133b3ff987b1c488db466729abc0`

panns-inference 0.0.7

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

PANN 推断

安装

用法

结果

引用

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史发布通知| RSS订阅

下载文件

源分布

内置分布

panns-inference 0.0.7

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

PANN 推断

安装

用法

结果

引用

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史 发布通知| RSS订阅

下载文件

源分布

内置分布

发布历史发布通知| RSS订阅