pix2pix:pix2pix(cGAN)的Tensorflow实现用于音频源分离

时间:2024-05-29 10:40:07
【文件属性】:

文件名称:pix2pix:pix2pix(cGAN)的Tensorflow实现用于音频源分离

文件大小:5KB

文件格式:ZIP

更新时间:2024-05-29 10:40:07

Python

pix2pix 描述 这是使用pix2pix进行音频源分离(混合到人声)的。 我将原始数据(混合和人声对数据集)预处理为可以作为二维图像处理的声谱图,然后训练模型。 有关详细的超hyperparams.py ,请参见文件hyperparams.py。 要求 NumPy> = 1.11.1 TensorFlow> = 1.0.0 解放军 数据 我使用的DSD100数据集由成对的混合音频文件和人声音频文件组成。 完整的数据集(〜14 GB)可以在下载。 文件描述 hyperparams.py包含所有需要的超级参数。 data.py加载训练数据并将其预处理为原始数据序列的单位。 modules.py包含网络的所有方法,构造块和跳过连接。 networks.py建立网络。 train.py用于培训。 训练网络 步骤1.如有必要,在hyperparams.py调整超级参数。 步骤2.如


【文件预览】:
pix2pix-master
----train.py(3KB)
----data.py(2KB)
----hyperparams.py(611B)
----README.md(1KB)
----network.py(351B)
----module.py(6KB)
----.gitignore(31B)

网友评论