文件名称:crnn_multitask_automatic_drum_transcription:音乐信息检索最终项目
文件大小:769.06MB
文件格式:ZIP
更新时间:2024-04-18 00:17:57
JupyterNotebook
评估多任务和单任务CRNN模型以实现自动鼓转录 该是我在巴塞罗那Pompeu Fabra大学的声音和音乐计算硕士的音乐信息检索课程的最终项目的一部分。 笔记本随附的报告可在找到。 概括 假设不同任务之间存在统计关系,则多任务学习可以提高数据驱动模型的通用性和鲁棒性。 自动鼓转录(ADT)的最新方法通过训练ADT系统以及节拍和下拍检测任务来利用西方鼓演奏的本地周期性。 虽然大多数ADT词汇表仅包含三种最常见的鼓乐器(踢鼓,军鼓和踩-),但为较大的词汇转录训练此类模型时会遇到这样的困难,即可用的数据集无法提供明显的出现频率少一些鼓乐器。 最新方法使用合成数据集以及其他现有数据集来训练CRNN模型,以平衡仪器的出现。 在这个项目中,我在Groove MIDI数据集上比较了此CRNN模型的多任务版本及其单任务版本的性能。 设定环境 jupyter笔记本使用conda环境,可以通过在终端中运行以下命