文件名称:cbrTekStraktor:一个从漫画书中自动提取文本的应用程序。-开源
文件大小:6.75MB
文件格式:ZIP
更新时间:2024-07-28 04:41:16
开源软件
cbrTekStraktor 是一个应用程序,用于从漫画书阅读器文件 (CBR) 中存在的文本气泡或语音气泡中自动提取文本。 它的主要目标是对漫画书的文本进行分析。 然而,cbrTekStraktor 也可用于扫描或类似目的。 该应用程序还支持手动定义 CBR 文件中的文本区域。 该应用程序包括一个简单的图形编辑器,用于进一步处理提取的文本。 文本提取是通过统计和图形处理操作的结合来实现的。 它基于以下 3 种主要算法 - 彩色图像的二值化(Niblak 和其他方法) - 连接组件 - K-Means 聚类 Apache Tesseract 用于对提取的文本进行光学字符识别。 该应用程序的后续版本将与翻译软件集成,以提供漫画文本的自动翻译和翻译文本的重新插入