文件名称:基于非负张量分解的音频分类方法
文件大小:241KB
文件格式:PDF
更新时间:2020-12-01 05:57:13
矩阵分解
为了提高音频数据分类正确率,提出一种通过非负张量分解(NTF)的分类方法. 音频信号经过预处理后, 提取声学特征和感知特征参数,然后构建非负的 3 阶音频张量,其各阶分别对应特征、帧、样本;其次,通过 NTF 得到每一类音频的核张量与因子矩阵,让测试样本构建的张量与各类型音频的因子矩阵的转置进行张量乘,得到对 核张量的近似;最后,通过 Frobenius 范数进行相似性度量,完成分类. 使用古典音乐、流行音乐、语音、噪声 4 种 类型的音频数据测试分类效果. 结果表明,平均分类正确率在 85%,以上,说明该方法可以有效地完成音频分类