最近才刚用tesseract OCR字符识别,采用google上的API example,输入没有背景的中文文字图片进去,速率很慢,并且识别率也很低,才百分之五十多点!是不是有些设置可以提高呢?求用过tesseract的能人达士指教!
11 个解决方案
#1
这个本姑娘使用过。识别率低是因为tesseract 想做到适应各种字体、各种分辨率。要在工程中用的话,可以先用tesseract 识别,再根据错误类型二次识别。根据我的经验,tesseract 的错误还是比较有规律的
#2
#lhfslhfs,根据错误类型二次识别是指什么呢?怎么看出它错误的规律呢?
#3
你把tesseract 出错的归类,就会发现它出错的规律,你对tesseract 容易出错的识别的结果再次用自己的算法识别
#4
我只用过ms的ocr
#5
#lhfslhfs,听上去像庞大的工程,最近比较急,能否给点可以迅速加快的建议呢?或者你能把你的经验分享一下么?
#6
#smwhotjay,微软的OCR是要装MODI么?
#7
tesseract OCR 训练样本
百度这个关键字,训练以后识别率会高出很多。
百度这个关键字,训练以后识别率会高出很多。
#8
感觉没用啊,再怎么训练能有自带的中文库好么
#9
请问这个问题您解决了嘛?
#10
楼主后来有没有想到解决方案?或者其他能提高准确率的方法?
#11
你呢?有办法吗?
#1
这个本姑娘使用过。识别率低是因为tesseract 想做到适应各种字体、各种分辨率。要在工程中用的话,可以先用tesseract 识别,再根据错误类型二次识别。根据我的经验,tesseract 的错误还是比较有规律的
#2
#lhfslhfs,根据错误类型二次识别是指什么呢?怎么看出它错误的规律呢?
#3
你把tesseract 出错的归类,就会发现它出错的规律,你对tesseract 容易出错的识别的结果再次用自己的算法识别
#4
我只用过ms的ocr
#5
#lhfslhfs,听上去像庞大的工程,最近比较急,能否给点可以迅速加快的建议呢?或者你能把你的经验分享一下么?
#6
#smwhotjay,微软的OCR是要装MODI么?
#7
tesseract OCR 训练样本
百度这个关键字,训练以后识别率会高出很多。
百度这个关键字,训练以后识别率会高出很多。
#8
感觉没用啊,再怎么训练能有自带的中文库好么
#9
请问这个问题您解决了嘛?
#10
楼主后来有没有想到解决方案?或者其他能提高准确率的方法?
#11
你呢?有办法吗?