文件名称:bird-species-classification:使用卷积神经网络在鸟类歌曲数据上使用相应的物种标签构建和训练鸟类物种分类器
文件大小:6.54MB
文件格式:ZIP
更新时间:2024-05-24 19:37:43
master-thesis convolutional-neural-networks deep-residual-network bird-species-classification bird-audio-detection
免责声明 没有积极维护该存储库。 这是一篇硕士论文的结果,如果有人想复制论文的结果,可以将该代码作为参考。 鸟类种类分类 这些是在Chalmers University of Technology进行的硕士学位论文的项目文件。 该项目的目的是通过使用深度残差神经网络,多宽度频率增量数据增强和元数据融合来构建和训练鸟类分类器,从而改进最先进的鸟类分类器。带有相应物种标签的鸟类歌曲数据。 如果该资料库对您的研究有用,请引用硕士论文。 设置 $ git clone https://github.com/johnmartinsson/bird-species-classification $ virtualenv -p /usr/bin/python3.6 venv $ source venv/bin/activate (venv)$ pip install -r requirements.txt
【文件预览】:
bird-species-classification-master
----setup.py(616B)
----.gitignore(1KB)
----train_model.py(7KB)
----images()
--------LIFECLEF2014_BIRDAMAZON_XC_WAV_RN1955_seg_0_same_class_augmentation.png(444KB)
--------accuracy_ordered_by_trainingsamples.png(26KB)
--------2017_01_17_16:33:16_cuberun.png(75KB)
--------nips4b_birds_trainfile003.png(160KB)
--------nips4b_birds_trainfile002_1.png(159KB)
--------nips4b_birds_trainfile001.png(222KB)
--------2016_12_17_01:51:48_cuberun.png(89KB)
--------signal_1.png(173KB)
--------augmented_signal.png(183KB)
--------optimizer_history.png(106KB)
--------signal_2_2.png(281KB)
--------signal_1_2.png(299KB)
--------signal_2.png(91KB)
--------decending_accuracy_by_sound_class.png(24KB)
--------mfcc_resized.png(76KB)
--------2016_12_19_13:10:33_cuberun.png(77KB)
--------2017_01_18_03:42:42_resnet_18.png(103KB)
--------LIFECLEF2014_BIRDAMAZON_XC_WAV_RN3508_noise_signal.png(408KB)
--------log_amp_spectrogram.png(325KB)
--------2017_01_17_15:39:28_cuberun.png(64KB)
--------training_samples_by_number_of_predictions.png(54KB)
--------bot_100_resnet_18_confusion_matrix.png(10KB)
--------bot_100_resnet_sound_class_by_accuracy.png(18KB)
--------nips4b_birds_trainfile002.png(171KB)
--------2017_01_11_01:15:36_cuberun.png(52KB)
--------2016_12_20_14:35:48_resnet.png(85KB)
--------2017_01_18_13:12:36_cuberun.png(70KB)
--------2017_01_17_19:00:18_cuberun.png(58KB)
--------few_mfccs_resnet_34.png(51KB)
--------nips4b_birds_trainfile003_1.png(131KB)
--------original_spectrogram.png(384KB)
--------nips4b_birds_trainfile001_1.png(229KB)
--------augmented_signal_2.png(336KB)
--------bot_100_cuberun_confusion_matrix_1.png(10KB)
--------history_bot_100_resnet.png(40KB)
--------accuracy_and_energy.png(52KB)
--------logspectrogram.png(356KB)
--------train_cuberun_240_epochs_amp_spec.png(184KB)
--------bot_100_cuberun_confusion_matrix_2.png(10KB)
--------2016_12_17_14:42:03_cuberun.png(93KB)
--------bot_100_cuberun_sound_class_by_accuracy.png(18KB)
--------2016_12_20_16:47:03_resnet.png(97KB)
--------train_resnet_60_epochs.png(163KB)
--------mfcc.png(46KB)
--------history_bot_100_cuberun.png(29KB)
--------amp_spectrogram.png(49KB)
--------2017_01_18_13:12:41_resnet_18.png(79KB)
--------LIFECLEF2015_BIRDAMAZON_XC_WAV_RN29592_seg_6_noise_augmentation.png(444KB)
--------train_cuberun_60_epochs_log_amp_spec.png(158KB)
--------history_bot_100_2_cuberun.png(30KB)
--------sound_class_sorted_by_accuracy.png(22KB)
----create_dataset.py(3KB)
----benchmark.py(7KB)
----requirements.txt(197B)
----bird()
--------preprocessing.py(9KB)
--------signal_processing.py(1KB)
--------.gitignore(12B)
--------visualizer.py(21KB)
--------loader.py(4KB)
--------__init__.py(0B)
--------models()
--------analysis.py(1KB)
--------generators()
--------utils.py(4KB)
--------data_augmentation.py(2KB)
----run_job.sh(184B)
----LICENSE(1KB)
----conf.ini(710B)
----preprocess_birdclef.py(2KB)
----data_analysis.py(6KB)
----run_predictions.py(2KB)
----vis.py(8KB)
----scripts()
--------pp.py(168B)
--------create_birdclef_subset.py(3KB)
--------separate_mlsp2013_test_files.py(719B)
--------split_data.py(1KB)
--------count.py(1KB)
--------tutorial.py(3KB)
--------structure_mlsp2013_dataset.py(2KB)
--------predict.py(962B)
----README.md(6KB)
----tests()
--------__init__.py(0B)
--------bird_tests.py(187B)
----run_job_evaluate.sh(248B)
----evaluate.py(7KB)
----submit_job.sh(253B)
----train.py(4KB)