文件名称:audio_to_midi:一个CNN,可将钢琴音频转换为简化的MIDI格式
文件大小:17.58MB
文件格式:ZIP
更新时间:2024-06-05 22:26:54
python data-science deep-learning tensorflow keras
audio_to_midi 卷积神经网络,可将钢琴音频转换为简化的MIDI格式。 最终模型将音频文件(单音或多音)作为输入,并输出带有相应音符和音符持续时间的简化MIDI输出。 然后可以将该输出重构为标准MIDI文件格式。 主要目标 CNN执行的自动转换是朝自动音乐转录(AMT)更大目标迈出的一步。 AMT和音乐信息检索在行业中有许多应用,包括数字音频工作站软件开发和音乐推荐系统。 设置 首先,从Saarland Music数据集下载数据,将音频放在一个名为“ audio”的目录中,将MIDI放在另一个名为“ midi”的目录中: mkdir audio wget "http://resources.mpi-inf.mpg.de/SMD/SMD_MIDI-Audio-Piano-Music.html" -e robots=off -r -l1 -nd --no-parent -A.
【文件预览】:
audio_to_midi-master
----get_model_prediction.py(4KB)
----.gitattributes(67B)
----normalisation.py(4KB)
----encode_midi_segments.py(2KB)
----decode_midi.py(3KB)
----non_assert_tests.py(13KB)
----cqt.py(512B)
----check_robust.py(4KB)
----exploratory_visualization.py(2KB)
----models.py(11KB)
----benchmark.py(1KB)
----README.md(2KB)
----model_and_visualizations.1363()
--------.1363mae.png(19KB)
--------.1363r2.png(20KB)
--------.1363.png(25KB)
--------weights-improvement-38-0.1363.hdf5(18.15MB)
----handle_complex_nums.py(343B)
----create_dataset.py(17KB)
----audio_to_midi_paper.pdf(519KB)