seq2seq-layout-analysis:基于send2seq的end2end布局分析

时间:2024-04-08 14:24:50
【文件属性】:

文件名称:seq2seq-layout-analysis:基于send2seq的end2end布局分析

文件大小:1.7MB

文件格式:ZIP

更新时间:2024-04-08 14:24:50

Python

票据类版面分析算法 当前OCR之后的版本面分析工作大家都是规则编写的,本人也遭受规则之苦,看到ocr输出的一大堆文字和坐标就头皮发麻。一个基于seq2seq的端到端版面分析算法,希望能够帮到各位ocrer。 思路:通过有监督方式训练句向量,然后通过seq2seq的方式学习box类别 链接: : 使用方法 准备数据 首先利用自己的OCR算法,将票据图片文字识别出来 将结果存入labelme临时json 使用labelme在groupid里标注所需要提取的box类别 将标注数据放入数据对应的train和test文件夹下 数据样例参考data / train / 1.json 修改config.py其中5个参数,其余可根据情况调试 self.class_char # 标签列表(对应groupid) self.max_text_len = 20 #


【文件预览】:
seq2seq-layout-analysis-main
----weight()
--------stoi.npy(3KB)
--------rnn.pt(270KB)
--------s2s.pt(1.15MB)
--------embed.npy(99KB)
----models()
--------__pycache__()
--------TextRNN.py(1KB)
--------Seq2Seq.py(4KB)
----processing.py(2KB)
----data()
--------train()
--------test()
----rnn_train.py(5KB)
----rnn_w2v.py(1KB)
----rnn_infer.py(2KB)
----requirements.txt(33B)
----s2s_dataset.py(4KB)
----config.py(2KB)
----README.md(1KB)
----s2s_train.py(4KB)
----infer.py(2KB)
----rnn_dataset.py(2KB)

网友评论