Perceptual-Coding-In-Python

时间:2024-06-26 03:02:26
【文件属性】:

文件名称:Perceptual-Coding-In-Python

文件大小:228.76MB

文件格式:ZIP

更新时间:2024-06-26 03:02:26

MATLAB

Python 中的感知编码 由斯蒂芬·韦尔奇和马修·科恩创建 ###研究问题:我们如何测量两个信号听起来的相似程度? ###介绍 量化人类对物理现象的感知是一项复杂的任务,涉及多个学科。 语音和图像识别是相对成熟的领域,通过在大型标记数据集上训练深度神经网络,在过去几年中取得了特别的进展。 值得注意的是,对于语音和图像识别,SIFT 和 MFCC 等手工设计的特征正在Swift被学习特征所取代。 很难说深度学习范式是否会取代、增强或提供对与量化声音感知有关的其他相关领域的更多见解。 我们认为相关工作可以大致分为以下几个领域:音频压缩和感知编码、音乐信息检索、机器学习和音频质量测量。 ###音频压缩 音频压缩技术在以高压缩率实现卓越质量方面取得了令人难以置信的成功。 Mp3 和 AAC 算法处于国际标准所描述的高级水平,但在实现中主要是启发式驱动的。 有许多可用的开源实现,但最好和最常用


网友评论