文件名称:在UCF101上使用3D CNN/CNN + RNN进行视频分类/动作识别的教程-python
文件大小:8.78MB
文件格式:ZIP
更新时间:2024-07-08 14:57:11
机器学习
在UCF101上使用3D CNN/CNN + RNN进行视频分类/动作识别的教程 视频分类 该存储库使用 UCF101 和 PyTorch 为视频分类(或动作识别)构建了一个快速而简单的代码。 视频被视为一个 3D 图像或几个连续的 2D 图像(图 1)。 下面是两个简单的神经网络模型:数据集 UCF101 共有来自 101 个动作的 13,320 个视频。 视频具有不同的时间长度(帧)和不同的 2d 图像大小; 最短的是28帧。 为了避免像 OpenCV 或 FFmpeg 这样的帧提取和转换等痛苦的视频预处理,这里我直接使用了来自 feichtenhofer 的预处理数据集。 如果您想从头开始转换或提取视频帧,这里有一些不错的教程:https://pythonprogramming.net/loading-video-python-opencv-tutorial/ https://www.pyimagesearch.com/2017/02/ 06/faster-video-file-fps-with-cv2-videocapture-and-opencv/ 模型 1. 3
【文件预览】:
video-classification-master
----ResNetCRNN_varylength()
--------functions.py(12KB)
--------ResNetCRNN_check_prediction.py(4KB)
--------UCF101_frame_count.pkl(428KB)
--------UCF101_ResNetCRNN_varlen.py(10KB)
--------UCF101_tvflow_v_frame_count.pkl(418KB)
--------results()
--------UCF101_tvflow_u_frame_count.pkl(418KB)
--------UCF101actions.pkl(2KB)
--------check_predictions()
----Conv3D()
--------functions.py(15KB)
--------Conv3D_check_prediction.py(3KB)
--------__pycache__()
--------.DS_Store(6KB)
--------outputs()
--------UCF101_3DCNN.py(8KB)
--------UCF101actions.pkl(2KB)
--------check_predictions()
----CRNN()
--------functions.py(15KB)
--------__pycache__()
--------.DS_Store(6KB)
--------outputs()
--------UCF101_CRNN.py(9KB)
--------CRNN_check_prediction.py(4KB)
--------UCF101actions.pkl(2KB)
--------check_predictions()
----.DS_Store(8KB)
----ResNetCRNN()
--------functions.py(15KB)
--------ResNetCRNN_check_prediction.py(4KB)
--------__pycache__()
--------.DS_Store(6KB)
--------outputs()
--------UCF101_ResNetCRNN.py(9KB)
--------UCF101actions.pkl(2KB)
--------check_predictions()
----README.md(7KB)
----fig()
--------loss_3DCNN.png(867KB)
--------wrong_pred.png(124KB)
--------loss_ResNetCRNN.png(1.04MB)
--------f_CNN.png(27KB)
--------.DS_Store(6KB)
--------kayaking.gif(2.22MB)
--------loss_CRNN.png(981KB)
--------CRNN.png(647KB)