文件名称:speech-enhancement-dns-comparison:语音增强深度学习架构比较
文件大小:109.86MB
文件格式:ZIP
更新时间:2024-04-18 06:24:27
JupyterNotebook
用于单通道语音增强的深噪声抑制模型的比较评估 考虑到视频会议系统和流传输工具的日益增加的使用,具有计算有效和有效的语音增强器变得有利和必要。 Microsoft DNS挑战极大地促进了该领域的创新,但仍有很大的改进空间。 这项工作比较了此挑战中提出的两种用于语音增强的深度学习模型:NSNet2和双信号转换LSTM网络(DTLN)。 在基于混响时间RT60和信噪比(SNR)规范的两种对比条件下,分别使用两个数据集和三种不同的以语音质量为中心的措施对这两种模型进行了比较:语音质量的感知评估(PESQ),深噪声抑制平均意见分数(DNSMOS)和虚拟语音质量目标听众(ViSQOL)。 概述 这是“单声道语音增强的深噪声抑制模型的比较评估”研究报告的伴随代码,该研究由EstebanGómez进行,该研究是巴塞罗那Pompeu Fabra大学的声音和音乐计算硕士学位的学生,是音乐信息的一部分检索过程。