emotion_detection_cpc:音频中的情感检测,利用受对比预测编码(CPC)训练的自我监督表示

时间:2024-06-16 15:24:52
【文件属性】:

文件名称:emotion_detection_cpc:音频中的情感检测,利用受对比预测编码(CPC)训练的自我监督表示

文件大小:55KB

文件格式:ZIP

更新时间:2024-06-16 15:24:52

machine-learning speech emotion pytorch emotion-detection

motion_detection_cpc 此存储库提供了使用语音作为输入的情感识别系统的代码。 通过使用对比预测编码(CPC)训练的自我监督表示,可以提高性能。 使用CPC时,结果的准确度从71%的基线提高到80%,这是30%的相对显着误差降低。 博客在这里: : 初始设置 安装依赖项 virtualenv -p python3.7 venv source venv/bin/activate make deps 下载资料 wget https://zenodo.org/record/1188976/files/Audio_Speech_Actors_01-24.zip $HOME/RAVDESS/Audio_Speech_Actors_01-24.zip unzip $HOME/RAVDESS/Audio_Speech_Actors_01-24.zip 创建训练,验证和测试数据


【文件预览】:
emotion_detection_cpc-master
----pyproject.toml(100B)
----parse_emotion_dataset.py(4KB)
----.pylintrc(2KB)
----data()
--------val.ordered.dbl(7KB)
--------train.dbl(61KB)
--------test.ordered.dbl(9KB)
--------train.ordered.dbl(61KB)
--------metadata.json(448KB)
--------val.dbl(7KB)
--------emotion_set.txt(55B)
--------test.dbl(9KB)
--------single.dbl(53B)
----cpc()
--------train.py(8KB)
--------.DS_Store(6KB)
--------__init__.py(0B)
--------model.py(7KB)
----util.py(11KB)
----LICENSE(1KB)
----requirements.txt(254B)
----emotion_id()
--------train.py(14KB)
--------__init__.py(0B)
--------wavenet.py(4KB)
--------decode.py(4KB)
--------model.py(7KB)
--------score.py(4KB)
----.gitignore(100B)
----dataloader()
--------audio.py(7KB)
----Makefile(736B)
----README.md(2KB)
----.pre-commit-config.yaml(131B)

网友评论