文件名称:robustEvalSLU:重新思考端到端评估以了解口语
文件大小:3.54MB
文件格式:ZIP
更新时间:2024-05-03 22:43:59
Python
流利的语音命令
数据集
此存储库中的所有代码都将要求您具有Fluent Speech Commands数据集或Snips SmartLights数据集的副本。
流畅的语音命令(FSC)由[1]提出,可以在下载。
Snips SmartLights由介绍,可以在请求。 为简化起见,我们已将Snips数据集转换为FSC格式-可以在slu_splits/snips_close_field/original_splits下找到此数据。 为了遵守其许可证,我们不包含实际的音频文件。
复制数据
要生成本文针对FSC所述的“看不见的拆分”,请运行: python processing_scripts/resplit_data.py --data_dir
【文件预览】:
robustEvalSLU-main
----.gitmodules(108B)
----caches()
--------original_splits_delete_complete_snips_speaker_WER.pkl(114KB)
--------original_splits_insert_complete_snips_speaker_WER.pkl(114KB)
--------original_splits_replace_complete_snips_speaker_WER.pkl(114KB)
--------original_splits_replace_complete_speaker_WER.pkl(2.38MB)
--------original_splits_delete_complete_speaker_WER.pkl(2.38MB)
--------original_splits_insert_complete_speaker_WER.pkl(2.38MB)
----end-to-end-SLU()
----slu_splits()
--------snips_close_field()
--------.DS_Store(8KB)
--------fluent_speech_commands()
----README.md(3KB)
----processing_scripts()
--------get_snips_gcloud_transcripts.py(2KB)
--------draw_bleu_distribution_graph.py(3KB)
--------coordinate_ascent.py(7KB)
--------join_error_analysis_and_word_csvs.py(2KB)
--------get_gcloud_transcripts_from_json.py(2KB)
--------nonnative_speakers_snips.py(4KB)
--------__pycache__()
--------create_google_WER_bash.sh(68B)
--------analysis_utils.py(2KB)
--------create_google_WER_bash.py(309B)
--------resplit_data.py(24KB)
--------utility.py(52KB)
--------run_BLEU_script.sh(5KB)
--------convert_other_datasets.py(6KB)
--------fix_synthetic_data_paths.py(983B)
--------probability_utils.py(2KB)
--------draw_WER_distribution_graph.py(953B)
--------nonnative_speaker.py(3KB)
----gcloud_snips_transcription.csv(152KB)
----gcloud_transcription.csv(2.75MB)