文件名称:Action_Recognition
文件大小:406KB
文件格式:ZIP
更新时间:2024-04-28 15:06:37
Python
意图分类的动作识别 加州大学伯克利分校MIDS W251 Indrani Bose,Brian Ament和Mayukh Dutta 本质上,视频具有空间方面,即。 各个帧和时间方面,即框架的顺序。 某些动作(例如,站立,跑步等)可能仅通过使用单个框架即可识别,但对于更复杂的动作(例如,行走与奔跑,弯曲与跌落)可能需要不止一帧的信息才能正确识别。 本地时间信息在区分此类动作中起着重要作用。 此外,在某些使用情况下,本地时间信息还不够,您可能需要长时间的时间信息才能正确识别动作或对视频进行分类。深度学习方法已根据经验证明在学习用于对象识别,任务,图像字幕和语义分割。 卷积神经网络使我们能够通过参数共享卷积和局部不变性建立最大池神经元来有效捕获图像中数据结构空间局部性的假设。 在这个项目中,我们想探讨深度学习技术对视频任务(特别是动作识别)的影响。 返回目录 1.2项目目的 我们想探
【文件预览】:
Action_Recognition-master
----images()
--------Cover_page2.jpg(11KB)
--------Cover_page.jpg(10KB)
--------Capture.JPG(24KB)
--------Conv Res.JPG(9KB)
--------W251 System Design.png(51KB)
--------Cyclist Images.jpeg(247KB)
----torchvideoclf()
--------data()
--------download.py(3KB)
--------utils()
--------README.md(3KB)
--------.idea()
--------test.py(4KB)
--------train.py(9KB)
----README.md(9KB)
----metrics()
--------validation accuracy.svg(15KB)
--------train_loss.JPG(20KB)
--------lr.JPG(20KB)
--------training loss.svg(17KB)
--------learning rate.svg(19KB)
--------training accuracy.svg(17KB)
--------trin_acc.JPG(20KB)