开发一个文字识别软件(OCR)。

时间:2022-10-19 13:00:04
最近同老师开发一个文字识别软件(OCR)。
1.我想问怎样才能获取的WINDOWS的字体的点阵码?
2.我知MFC的CDC类中有函数GetGlyphOutLine()可获取字符轮廓线或位图数据(其nFormat参数为GGO_BITAMP)
希望能提供一些资料给我。THANK YOU

3 个解决方案

#1


如果你真的想做 OCR 的话, 文字样本需要打印出后重新用扫描仪扫描的方式得到。直接用 Windows 字体转换来的话恐怕只能写灌水 Paper 用。整个数据采集上花费至少数万元。

863 项目组专门拨经费进行过数据采集工作。目前,脱机手写体中文样本库 清华电子工程系丁晓青老师,自动化所戴汝为老师那里都有。而脱机印刷体中文样本库 清华电子工程系丁晓青老师,自动化所汉王那里有。

如果出于纯研究目的, 估计可以以很低的代价得到。让你的老师和他们联系一下吧。

#2


有无别的资料?
高手!!

#3


说了这么多,泥难道还想找获取字体点阵码的资料吗 ?Sigh.

关于OCR 方面的资料,泥可以查阅 -

英文:

ICDAR
IEEE Tran. PAMI
Journal of Pattern Recognition

国内杂志可参阅:

模式识别与人工智能

俺是菜鸟,具体问题建议泥还是请教泥老师或前面提到的权威吧 :-)

#1


如果你真的想做 OCR 的话, 文字样本需要打印出后重新用扫描仪扫描的方式得到。直接用 Windows 字体转换来的话恐怕只能写灌水 Paper 用。整个数据采集上花费至少数万元。

863 项目组专门拨经费进行过数据采集工作。目前,脱机手写体中文样本库 清华电子工程系丁晓青老师,自动化所戴汝为老师那里都有。而脱机印刷体中文样本库 清华电子工程系丁晓青老师,自动化所汉王那里有。

如果出于纯研究目的, 估计可以以很低的代价得到。让你的老师和他们联系一下吧。

#2


有无别的资料?
高手!!

#3


说了这么多,泥难道还想找获取字体点阵码的资料吗 ?Sigh.

关于OCR 方面的资料,泥可以查阅 -

英文:

ICDAR
IEEE Tran. PAMI
Journal of Pattern Recognition

国内杂志可参阅:

模式识别与人工智能

俺是菜鸟,具体问题建议泥还是请教泥老师或前面提到的权威吧 :-)