beamformers:易于使用的Beamformers用于多通道语音分离增强

时间:2024-06-14 12:33:04
【文件属性】:

文件名称:beamformers:易于使用的Beamformers用于多通道语音分离增强

文件大小:1.78MB

文件格式:ZIP

更新时间:2024-06-14 12:33:04

Python

变形金刚 该库实现了一些最著名的波束形成器,用于信号源分离和语音增强。 波束形成器易于使用,并且在有人想要了解如何自行实现的情况下,可以以最简单的方式实现。 该库的思想是提供一种简单的方法,将用于源分离和/或语音增强的波束成形直接应用于存储为numpy数组的多通道麦克风录音。 对于大多数波束形成器而言,唯一需要的信息是混合物的麦克风录音(或嘈杂的语音)以及单独的一段噪声录音。 无需提供导向向量,因为它是从数据中自动提取的(请参阅docs,以获取有关其工作原理的更多信息)。 如果可以的话,仅记录目标语音将有助于估计导向向量,从而提供更清晰的输出。 现在也可以使用基于掩模的波束形成器! 代码的某些部分是从借来的。 请参阅回购和以获取更多信息。 安装 简单地 pip install beamformers 或者 git clone https://github.com/Enny1991/


【文件预览】:
beamformers-master
----.travis.yml(237B)
----beamformers()
--------beamformers.py(32KB)
--------tests()
--------__init__.py(26B)
----requirements.txt(22B)
----examples()
--------example.py(4KB)
--------example.ipynb(172KB)
----setup.py(649B)
----LICENSE.md(1KB)
----.gitignore(118B)
----README.md(2KB)
----wavs()
--------sdw_nref.wav(63KB)
--------td_mvdr_wref.wav(63KB)
--------spk.wav(250KB)
--------td_mwf_wref.wav(63KB)
--------bfi.wav(63KB)
--------mwf.wav(63KB)
--------msnr_wref.wav(63KB)
--------mvdr_wref.wav(63KB)
--------mix.wav(250KB)
--------mvdr_nref.wav(63KB)
--------sdw_wref.wav(63KB)
--------sdw_mwf_nref.wav(250KB)
--------td_mvdr_nref.wav(63KB)
--------td_mwf_nref.wav(63KB)
--------nn.wav(250KB)
--------sdw_mwf_wref.wav(250KB)
--------test_out.wav(63KB)
--------gt.wav(63KB)
--------msnr_nref.wav(63KB)

网友评论