文件名称:减去图像均值matlab代码-End-to-End-Multi-View-Lipreading:端到端多视角唇读
文件大小:218KB
文件格式:ZIP
更新时间:2024-06-23 14:46:59
系统开源
热图像均值matlab代码概述 这是在 OuluVS2 数据集上测试的端到端多视图唇读的 Python 实现。 如果你在你的研究中使用这个包,请引用这篇论文: [1] 端到端多视图唇读,S. Petridis、Y. Wang、Z. Li、M. Pantic。 英国机器视觉会议。 伦敦,2017 年 9 月。 依赖关系 要运行代码,需要以下依赖项: miniconda2 matplotlib pydotplus 制表 scikit 学习 Python 枕头 西诺(CPU) 千层面 不学习 建议您使用 miniconda 来管理您的 python 环境。 Miniconda 可以从 下载。 不需要 CUDA 安装。 代码经过测试: Ubuntu 16.04、Python 2.7.13、Theano 0.9.0、千层面 0.2.dev1。 数据集 OuluVS2 视听数据库收集于芬兰奥卢大学计算机科学与工程系机器视觉研究中心。 它旨在促进视觉语音识别的研究,有时也称为自动唇读。 您需要签署许可协议才能使用此数据集。 详细信息可以在: 成功下载数据集后,您可以使用提供的脚本对数据集进行预处理。
【文件预览】:
End-to-End-Multi-View-Lipreading-main
----.gitignore(1KB)
----MatlabCode_forPretrainingRBMs()
--------preTrainEncoderWithRBMs.m(2KB)
----MatlabCode_forPreprocessingOulu()
--------ouluPreprocessingScript.m(3KB)
--------divideDataIntoTrainTestSubjInd.m(743B)
--------computeIter.m(368B)
--------computeMeanImRemovedSeq.m(542B)
--------computeTargetsPhrases.m(584B)
----preprocessOulu.pdf(107KB)
----oulu()
--------data()
--------extract_weights()
--------config()
----LICENSE(11KB)
----utils()
--------preprocessing.py(27KB)
--------io.py(1KB)
--------lcn.py(5KB)
--------signal.py(4KB)
--------ffmpeg.py(6KB)
--------plotting_utils.py(10KB)
--------regularization.py(596B)
--------datagen.py(12KB)
--------data_structures.py(2KB)
--------draw_net.py(5KB)
----README.md(6KB)
----runners()
--------3stream_final.py(24KB)
--------5stream_final.py(30KB)
--------4stream_final.py(27KB)
--------run_experiments.oulu_1stream.sh(1KB)
--------2stream_final.py(20KB)
--------experiments()
--------run_experiments.oulu_5stream.sh(1KB)
--------run_experiments.oulu_2stream.sh(1KB)
--------run_experiments.oulu_4stream.sh(1KB)
--------1stream_final.py(15KB)
--------run_experiments.oulu_3stream.sh(1KB)
----custom()
--------updates.py(3KB)
--------nonlinearities.py(597B)
--------layers.py(10KB)
--------objectives.py(2KB)
----modelzoo()
--------adenet_4stream.py(17KB)
--------pretrained_encoder.py(791B)
--------adenet_v2_2.py(6KB)
--------deltanet_majority_vote.py(9KB)
--------adenet_5stream.py(20KB)
--------adenet_3stream.py(13KB)
--------adenet_2stream.py(10KB)
--------adenet_3stream_dropout.py(7KB)