文件名称:tesseract-ocr实现图片识别功能(java)
文件大小:47.8MB
文件格式:ZIP
更新时间:2020-12-08 07:20:34
图像识别
一个Google支持的开源的OCR图文识别开源项目。去持多语言(当前3.02 版本支持包括英文,简体中文,繁体中文),支持Windows,Linux,Mac OSX 多平台。使用中Tesseract 的识别率非常高。可以参考网上的相关资料进行对Tesseract字符识别进行样本训练,通过使用训练后的语言库会提高识别精度。
【文件预览】:
testocr_01
----src()
--------libtesseract302.dll(1.91MB)
--------gsdll64.dll(14.1MB)
--------acts()
--------liblept168.dll(2.02MB)
----bin()
--------libtesseract302.dll(1.91MB)
--------gsdll64.dll(14.1MB)
--------acts()
--------liblept168.dll(2.02MB)
----eurotext.png(15KB)
----.classpath(731B)
----.settings()
--------org.eclipse.jdt.core.prefs(598B)
----libs()
--------jna-4.1.0.jar(893KB)
--------tess4j.jar(70KB)
--------swingx-1.6.1.jar(1.33MB)
--------ghost4j-0.5.1.jar(176KB)
--------log4j-1.2.17.jar(478KB)
--------jai_imageio.jar(1.09MB)
----.project(386B)
----eurotext.gif(20KB)
----eurotext.tif(100KB)
----eurotext.pdf(13KB)
----eurotext.bmp(100KB)
----tessdata()
--------eng.traineddata(20.86MB)
--------chi_sim.traineddata(38.12MB)