文件名称:kiss:论文代码“ KISS
文件大小:479KB
文件格式:ZIP
更新时间:2024-05-05 15:47:53
deep-learning chainer paper transformer scene-text-recognition
吻
纸代码。
该存储库包含您可以用来基于我们的论文训练模型的代码。 您还将找到有关如何访问我们的模型以及如何评估模型的说明。
预训练模型
您可以在找到预训练的模型。 下载zip并将其放入任何目录。 我们将这个目录称为
【文件预览】:
kiss-master
----train_text_recognition.py(15KB)
----data_server.py(590B)
----.gitignore(1KB)
----text()
--------__init__.py(0B)
--------lstm_text_localizer.py(2KB)
--------transformer_text_localizer.py(2KB)
--------text_recognizer.py(3KB)
--------text_localizer.py(4KB)
--------transformer_recognizer.py(4KB)
----config.cfg(2KB)
----evaluation()
--------__init__.py(0B)
--------custom_mean_evaluator.py(3KB)
--------rotation_detection_evaluator.py(4KB)
--------text_recognition_evaluator.py(11KB)
----functions()
--------rotation_droput.py(1KB)
--------__init__.py(0B)
----requirements.txt(183B)
----updaters()
--------__init__.py(0B)
--------transformer_text_updater.py(8KB)
----datasets()
--------__init__.py(0B)
--------text_recognition()
----__init__.py(1B)
----insights()
--------tensorboard_gradient_histogram.py(910B)
--------__init__.py(0B)
--------text_recognition_bbox_plotter.py(2KB)
--------bbox_plotter.py(23KB)
--------visual_backprop.py(2KB)
----optimizers()
--------__init__.py(0B)
--------radam.py(9KB)
----tensorboard_filter(383B)
----LICENSE(34KB)
----run_eval_on_all_datasets.py(5KB)
----README.md(8KB)
----train_utils()
--------DejaVuSans.ttf(739KB)
--------create_video.py(5KB)
--------__init__.py(0B)
--------char-map-bos.json(1KB)
--------dataset_utils.py(244B)
--------match_bbox.py(5KB)
--------updater_trigger.py(273B)
--------backup.py(3KB)
--------module_loading.py(486B)
--------README.md(130B)
--------show_progress.py(3KB)
--------autocopy.py(2KB)
--------tensorboard_utils.py(689B)
--------logger.py(1KB)
--------disable_chain.py(427B)
--------datatypes.py(83B)
----config()
--------__init__.py(0B)
--------recognition_config.py(1KB)
----iou()
--------__init__.py(0B)
--------bbox.py(15KB)
----image_manipulation()
--------image_masking.py(8KB)
--------__init__.py(0B)
----commands()
--------interactive_train.py(2KB)
--------__init__.py(0B)
----common()
--------dataset_management()
--------datasets()
--------__init__.py(0B)
--------utils.py(16KB)
----evaluate.py(16KB)
----resnet()
--------resnet_gn.py(8KB)
--------__init__.py(0B)
----transformer()
--------embedding.py(435B)
--------__init__.py(4KB)
--------positional_encoding.py(1KB)
--------utils.py(785B)
--------position_wise_feed_forward.py(635B)
--------attention.py(2KB)
--------encoder_decoder.py(968B)
--------decoder.py(2KB)
--------encoder.py(1KB)