有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

时间:2021-01-02 08:54:26
如题,有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?
最近才刚用tesseract OCR字符识别,采用google上的API example,输入没有背景的中文文字图片进去,速率很慢,并且识别率也很低,才百分之五十多点!是不是有些设置可以提高呢?求用过tesseract的能人达士指教!

11 个解决方案

#1


这个本姑娘使用过。识别率低是因为tesseract 想做到适应各种字体、各种分辨率。要在工程中用的话,可以先用tesseract 识别,再根据错误类型二次识别。根据我的经验,tesseract 的错误还是比较有规律的

#2


#lhfslhfs,根据错误类型二次识别是指什么呢?怎么看出它错误的规律呢? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#3


你把tesseract 出错的归类,就会发现它出错的规律,你对tesseract 容易出错的识别的结果再次用自己的算法识别

#4


有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?
我只用过ms的ocr 

#5


#lhfslhfs,听上去像庞大的工程,最近比较急,能否给点可以迅速加快的建议呢?或者你能把你的经验分享一下么? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#6


#smwhotjay,微软的OCR是要装MODI么? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#7


tesseract OCR 训练样本
百度这个关键字,训练以后识别率会高出很多。

#8


引用 7 楼 passFuHao 的回复:
tesseract OCR 训练样本
百度这个关键字,训练以后识别率会高出很多。
感觉没用啊,再怎么训练能有自带的中文库好么

#9


请问这个问题您解决了嘛?

#10


楼主后来有没有想到解决方案?或者其他能提高准确率的方法? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#11


引用 9 楼 XiaXianShen 的回复:
请问这个问题您解决了嘛?
你呢?有办法吗?

#1


这个本姑娘使用过。识别率低是因为tesseract 想做到适应各种字体、各种分辨率。要在工程中用的话,可以先用tesseract 识别,再根据错误类型二次识别。根据我的经验,tesseract 的错误还是比较有规律的

#2


#lhfslhfs,根据错误类型二次识别是指什么呢?怎么看出它错误的规律呢? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#3


你把tesseract 出错的归类,就会发现它出错的规律,你对tesseract 容易出错的识别的结果再次用自己的算法识别

#4


有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?
我只用过ms的ocr 

#5


#lhfslhfs,听上去像庞大的工程,最近比较急,能否给点可以迅速加快的建议呢?或者你能把你的经验分享一下么? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#6


#smwhotjay,微软的OCR是要装MODI么? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#7


tesseract OCR 训练样本
百度这个关键字,训练以后识别率会高出很多。

#8


引用 7 楼 passFuHao 的回复:
tesseract OCR 训练样本
百度这个关键字,训练以后识别率会高出很多。
感觉没用啊,再怎么训练能有自带的中文库好么

#9


请问这个问题您解决了嘛?

#10


楼主后来有没有想到解决方案?或者其他能提高准确率的方法? 有用过tesseract OCR字符识别的吗?怎么识别率那么低呢?

#11


引用 9 楼 XiaXianShen 的回复:
请问这个问题您解决了嘛?
你呢?有办法吗?