文件名称:tesseract-ocr 安装包
文件大小:13.54MB
文件格式:RAR
更新时间:2021-10-31 15:23:55
水印识别 数字识别
默认可以识别英文字符及数字,若需要识别中文字符,转至 https://download.csdn.net/download/chengzi_comm/10714777 页面下载。 识别引擎使用方式: 1. 解压安装到系统安装目录,比如"C:\Program Files (x86)\Tesseract-OCR" 2. pip install pytesseract 3. 将包pytesseract文件中的pytesseract.py中的tesseract_cmd关联到第一步安装的tesseract上,即注释掉tesseract_cmd = 'tesseract'这一行,并添加 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe',最后的tesseract.exe路径需要根据第一步解压目录来决定。
【文件预览】:
Tesseract-OCR
----tessdata()
--------configs()
--------eng.tesseract_cube.nn(996B)
--------eng.cube.fold(38B)
--------tessconfigs()
--------eng.cube.nn(837KB)
--------eng.cube.bigrams(168KB)
--------eng.traineddata(20.86MB)
--------eng.cube.word-freq(2.33MB)
--------eng.cube.lm(181B)
--------eng.cube.params(254B)
--------eng.cube.lm_(181B)
--------eng.cube.size(12.42MB)
----mftraining.exe(930KB)
----cntraining.exe(602KB)
----wordlist2dawg.exe(661KB)
----doc()
--------ReleaseNotes(13KB)
--------AUTHORS(158B)
--------COPYING(1007B)
--------phototest.tif(38KB)
--------eurotext.tif(100KB)
--------README(6KB)
----classifier_tester.exe(1.25MB)
----tesseract.exe(2.24MB)
----dawg2wordlist.exe(579KB)
----unicharset_extractor.exe(572KB)
----combine_tessdata.exe(567KB)
----ambiguous_words.exe(1.04MB)
----java()
--------ScrollView.jar(25KB)
----shapeclustering.exe(857KB)