kiss:论文代码“ KISS

时间:2024-05-05 15:47:53
【文件属性】:

文件名称:kiss:论文代码“ KISS

文件大小:479KB

文件格式:ZIP

更新时间:2024-05-05 15:47:53

deep-learning chainer paper transformer scene-text-recognition

吻 纸代码。 该存储库包含您可以用来基于我们的论文训练模型的代码。 您还将找到有关如何访问我们的模型以及如何评估模型的说明。 预训练模型 您可以在找到预训练的模型。 下载zip并将其放入任何目录。 我们将这个目录称为 。 准备使用代码 确保您的系统上至少安装了Python 3.7 创建一个新的虚拟环境(或任何您喜欢使用的环境) 使用pip install -r requirements.txt安装所有要求(如果您的PC中没有支持CUDA的设备,则应从文件requirements.txt删除cupy软件包)。 数据集 如果您希望像我们一样在相同的数据集上训练模型,则需要首先获取训练数据。 其次,您可以从获得我们使用的火车注释。 影像数据 您可以使用以下链接找到每个数据集的图像数据: MJSynth: ://www.robots.ox.ac.uk/~vgg/da


【文件预览】:
kiss-master
----train_text_recognition.py(15KB)
----data_server.py(590B)
----.gitignore(1KB)
----text()
--------__init__.py(0B)
--------lstm_text_localizer.py(2KB)
--------transformer_text_localizer.py(2KB)
--------text_recognizer.py(3KB)
--------text_localizer.py(4KB)
--------transformer_recognizer.py(4KB)
----config.cfg(2KB)
----evaluation()
--------__init__.py(0B)
--------custom_mean_evaluator.py(3KB)
--------rotation_detection_evaluator.py(4KB)
--------text_recognition_evaluator.py(11KB)
----functions()
--------rotation_droput.py(1KB)
--------__init__.py(0B)
----requirements.txt(183B)
----updaters()
--------__init__.py(0B)
--------transformer_text_updater.py(8KB)
----datasets()
--------__init__.py(0B)
--------text_recognition()
----__init__.py(1B)
----insights()
--------tensorboard_gradient_histogram.py(910B)
--------__init__.py(0B)
--------text_recognition_bbox_plotter.py(2KB)
--------bbox_plotter.py(23KB)
--------visual_backprop.py(2KB)
----optimizers()
--------__init__.py(0B)
--------radam.py(9KB)
----tensorboard_filter(383B)
----LICENSE(34KB)
----run_eval_on_all_datasets.py(5KB)
----README.md(8KB)
----train_utils()
--------DejaVuSans.ttf(739KB)
--------create_video.py(5KB)
--------__init__.py(0B)
--------char-map-bos.json(1KB)
--------dataset_utils.py(244B)
--------match_bbox.py(5KB)
--------updater_trigger.py(273B)
--------backup.py(3KB)
--------module_loading.py(486B)
--------README.md(130B)
--------show_progress.py(3KB)
--------autocopy.py(2KB)
--------tensorboard_utils.py(689B)
--------logger.py(1KB)
--------disable_chain.py(427B)
--------datatypes.py(83B)
----config()
--------__init__.py(0B)
--------recognition_config.py(1KB)
----iou()
--------__init__.py(0B)
--------bbox.py(15KB)
----image_manipulation()
--------image_masking.py(8KB)
--------__init__.py(0B)
----commands()
--------interactive_train.py(2KB)
--------__init__.py(0B)
----common()
--------dataset_management()
--------datasets()
--------__init__.py(0B)
--------utils.py(16KB)
----evaluate.py(16KB)
----resnet()
--------resnet_gn.py(8KB)
--------__init__.py(0B)
----transformer()
--------embedding.py(435B)
--------__init__.py(4KB)
--------positional_encoding.py(1KB)
--------utils.py(785B)
--------position_wise_feed_forward.py(635B)
--------attention.py(2KB)
--------encoder_decoder.py(968B)
--------decoder.py(2KB)
--------encoder.py(1KB)

网友评论