文件名称:tesseract3.02同语言多字体训练批处理程序和材料
文件大小:1.6MB
文件格式:ZIP
更新时间:2017-12-03 16:43:19
tesseract 3.02 训练
主要是参考tesseract3.02官网的训练教程,再结合自己的摸索,材料里包含的批处理程序完成从tif训练文件的输入到trainedata语料库文件生成的全过程,带有详细的注释,材料包的样例可以帮助更好的了解训练,详细的可以参考我的博客http://blog.csdn.net/tuling_research/article/details/41091163
【文件预览】:
同语言多字体训练材料
----eng.unicharset(4KB)
----eng.shapetable(1KB)
----eng.traineddata(490KB)
----eng.freq-dawg(90B)
----eng.frequent_words_list(28B)
----eng.timesnewroman.exp0.box(41KB)
----unicharset(4KB)
----eng.timesnewroman.exp0.tr(2.79MB)
----eng.normproto(8KB)
----eng.word-dawg(554B)
----eng.timesnewroman.exp0.txt(210B)
----eng.harlowsoliditalic.exp0.tif(390KB)
----eng.harlowsoliditalic.exp0.tr(1.93MB)
----eng.words_list(286B)
----eng.pffmtable(470B)
----eng.inttemp(476KB)
----eng.font_properties(58B)
----eng.timesnewroman.exp0.tif(520KB)
----eng.harlowsoliditalic.exp0.box(31KB)
----eng.harlowsoliditalic.exp0.txt(227B)
mutifont_train.bat