文件名称:Object_Detection:在Pytorch中实现自动字幕生成图像的算法
文件大小:15.54MB
文件格式:ZIP
更新时间:2024-05-28 15:22:23
JupyterNotebook
对象检测 实现在Pytorch中自动生成图像字幕的算法。 单发检测用于从图像中提取特征,这些特征将传递给LSTM进行字幕生成。 SSD实现的灵感来自杰里米·霍华德(Jeremy Howard)的深度学习第2部分。 single_object_pascal.ipynb:此代码仅检测每个图像中的最大对象及其边界框坐标。 multiple_objects.ipynb:此代码检测图像中的多个对象以及它们在图像中的位置。 basic_char_level_rnn.ipynb:通过构建简单的名称生成器来了解rnns的工作方式。 coco_preprocessing.ipynb:使用COCO API对coco数据集进行预处理。 word_level_rnn.ipynb:扩展字符级别rnn以生成工作。 仍在进行中。
【文件预览】:
Object_Detection-master
----multiple_object.ipynb(1.21MB)
----coco_preprocessing.ipynb(1.02MB)
----word_level_rnn.ipynb(14KB)
----baseline.ipynb(445KB)
----README.md(808B)
----baseline (1).ipynb(580KB)
----basic_char_level_rnn.ipynb(10KB)
----multiple_object_plus_bb.ipynb(9.52MB)
----train2014.csv(5.02MB)
----val2014.csv(2.45MB)
----single_object_pascal.ipynb(5.6MB)