文件名称:LipNet:从tensorflow中的python实时视频中自动读取Lip
文件大小:170.47MB
文件格式:ZIP
更新时间:2024-02-25 01:07:35
python deep-learning jupyter-notebook lip-reading JupyterNotebookJupyterNotebook
利普网 该项目基本上是由Yannis M. Assael,Brendan Shillingford,Shimon Whiteson,Nando de Freitas牛津大学于2016年与Google精打细算的合作发起的。朗读是从说话者的嘴巴运动中解码文本的任务。 传统方法将问题分为两个阶段:设计或学习视觉特征以及预测。 较新的深层唇读方法是端到端可培训的(Wand等人,2016; Chung&Zisserman,2016a)。 但是,现有的端到端训练模型研究仅执行单词分类,而不执行句子级序列预测。 研究表明,较长的单词可以使人的唇读性能提高(Easton&Basala,1982),这表明在模糊