文件名称:pixel_link-master.zip
文件大小:420KB
文件格式:ZIP
更新时间:2022-07-20 10:09:17
ocr 深度学习 文本行定位 自然场景
自然场景 文本行定位 pixel-link PixelLink放弃了边框回归的思想,采用实例分割的方法,分割出文本行区域,然后直接找对应文本行的外接矩形框.
【文件预览】:
pixel_link-master
----.gitmodules(74B)
----pixel_link_decode.pyx(3KB)
----test_pixel_link_on_any_image.py(6KB)
----nets()
--------pixel_link_symbol.py(15KB)
--------__init__.py(0B)
--------vgg.py(2KB)
----preprocessing()
--------ssd_vgg_preprocessing.py(20KB)
--------__init__.py(1B)
--------preprocessing_factory.py(2KB)
--------tf_image.py(16KB)
----train_pixel_link.py(13KB)
----LICENSE(1KB)
----tf_extended()
--------metrics.py(4KB)
--------bboxes.py(11KB)
--------__init__.py(900B)
--------math.py(1KB)
----samples()
--------img_249_pred.jpg(196KB)
--------img_333_pred.jpg(185KB)
----pixel_link.py(13KB)
----.gitignore(1KB)
----config.py(7KB)
----visualize_detection_result.py(3KB)
----pylib()
----pixel_link_env.txt(1KB)
----test_pixel_link.py(7KB)
----README.md(4KB)
----scripts()
--------test_any.sh(344B)
--------train.sh(1KB)
--------vis.sh(117B)
--------test.sh(161B)
----datasets()
--------dataset_utils.py(10KB)
--------synthtext_to_tfrecords.py(5KB)
--------icdar2015_to_tfrecords.py(3KB)
--------dataset_factory.py(2KB)
--------__init__.py(1B)