【文件属性】:
文件名称:减去图像均值matlab代码-End-to-End-Multi-View-Lipreading:端到端多视角唇读
文件大小:218KB
文件格式:ZIP
更新时间:2021-06-03 21:00:19
系统开源
热图像均值matlab代码概述
这是在
OuluVS2
数据集上测试的端到端多视图唇读的
Python
实现。
如果你在你的研究中使用这个包,请引用这篇论文:
[1]
端到端多视图唇读,S.
Petridis、Y.
Wang、Z.
Li、M.
Pantic。
英国机器视觉会议。
伦敦,2017
年
9
月。
依赖关系
要运行代码,需要以下依赖项:
miniconda2
matplotlib
pydotplus
制表
scikit
学习
Python
枕头
西诺(CPU)
千层面
不学习
建议您使用
miniconda
来管理您的
python
环境。
Miniconda
可以从
下载。
不需要
CUDA
安装。
代码经过测试:
Ubuntu
16.04、Python
2.7.13、Theano
0.9.0、千层面
0.2.dev1。
数据集
OuluVS2
视听数据库收集于芬兰奥卢大学计算机科学与工程系机器视觉研究中心。
它旨在促进视觉语音识别的研究,有时也称为自动唇读。
您需要签署许可协议才能使用此数据集。
详细信息可以在:
成功下载数据集后,您可以使用提供的脚本对数据集进行预处理。
【文件预览】:
End-to-End-Multi-View-Lipreading-main
----.gitignore(1KB)
----MatlabCode_forPretrainingRBMs()
--------preTrainEncoderWithRBMs.m(2KB)
----MatlabCode_forPreprocessingOulu()
--------ouluPreprocessingScript.m(3KB)
--------divideDataIntoTrainTestSubjInd.m(743B)
--------computeIter.m(368B)
--------computeMeanImRemovedSeq.m(542B)
--------computeTargetsPhrases.m(584B)
----preprocessOulu.pdf(107KB)
----oulu()
--------data()
--------extract_weights()
--------config()
----LICENSE(11KB)
----utils()
--------preprocessing.py(27KB)
--------io.py(1KB)
--------lcn.py(5KB)
--------signal.py(4KB)
--------ffmpeg.py(6KB)
--------plotting_utils.py(10KB)
--------regularization.py(596B)
--------datagen.py(12KB)
--------data_structures.py(2KB)
--------draw_net.py(5KB)
----README.md(6KB)
----runners()
--------3stream_final.py(24KB)
--------5stream_final.py(30KB)
--------4stream_final.py(27KB)
--------run_experiments.oulu_1stream.sh(1KB)
--------2stream_final.py(20KB)
--------experiments()
--------run_experiments.oulu_5stream.sh(1KB)
--------run_experiments.oulu_2stream.sh(1KB)
--------run_experiments.oulu_4stream.sh(1KB)
--------1stream_final.py(15KB)
--------run_experiments.oulu_3stream.sh(1KB)
----custom()
--------updates.py(3KB)
--------nonlinearities.py(597B)
--------layers.py(10KB)
--------objectives.py(2KB)
----modelzoo()
--------adenet_4stream.py(17KB)
--------pretrained_encoder.py(791B)
--------adenet_v2_2.py(6KB)
--------deltanet_majority_vote.py(9KB)
--------adenet_5stream.py(20KB)
--------adenet_3stream.py(13KB)
--------adenet_2stream.py(10KB)
--------adenet_3stream_dropout.py(7KB)