文件名称:Video-Captioning:视频字幕是一种基于序列到序列学习的编码器解码器模式
文件大小:125.19MB
文件格式:ZIP
更新时间:2024-03-24 12:19:35
JupyterNotebook
视频字幕 视频字幕是一种基于序列到序列学习的编码器解码器模式。 它以视频作为输入,并生成描述视频中事件的标题。 字幕的重要性在于其以多种方式使视频更易于访问的能力。 自动视频字幕生成器可帮助更好地搜索网站中的视频。 它可以根据其内容更容易地用于视频的群集。 目录 灵感 当我遇到视频字幕时,我正在寻找一些新项目,但我意识到缺乏好的资源。 我希望这个项目可以使人们更轻松地实现视频字幕。 样品结果 这是对测试数据的实时预测的一个片段。 数据集 该项目基于数据集。 它包含1450个培训视频和100个测试视频。 设置 克隆存储库: git clone https://github.com/Shreyz-max/Video-Captioning.git 视频字幕生成器: cd Video-Captioning 创建环境: conda create -n video_caption python
【文件预览】:
Video-Captioning-main
----train.py(8KB)
----config.py(328B)
----model_final()
--------decoder_model_weights.h5(18.68MB)
--------encoder_model.h5(36.02MB)
--------tokenizer1500(177KB)
----images()
--------accuracy.png(12KB)
--------J_evFB7RIKA_104_120.gif(20.75MB)
--------predict_realtime.gif(7.8MB)
--------shPymuahrsc_5_12.gif(9.51MB)
--------5HAf_INrFy0_3_25.gif(3.41MB)
--------loss.png(13KB)
--------model_inference_encoder.png(21KB)
--------model_train.png(46KB)
--------TZ860P4iTaM_15_28.gif(1.42MB)
--------model_inference_decoder.png(35KB)
--------qeKX-N1nKiM_0_5.gif(4.7MB)
--------0lh_UWF9ZP4_62_69.gif(3.37MB)
--------Je3V7U5Ctj4_569_576.gif(1.46MB)
--------k5OKBX2e7xA_19_32.gif(4.98MB)
--------ezgif-4-989de822710c.gif(4.8MB)
--------7NNg0_n-bS8_21_30.gif(6.65MB)
----requirements.txt(860B)
----extract_features.py(3KB)
----README.md(7KB)
----data()
--------training_data()
--------testing_data()
----Video_Captioning.ipynb(23.28MB)
----predict_test.py(8KB)
----_config.yml(26B)
----predict_realtime.py(10KB)