基于残差连接的改进端到端文本识别网络结构下载

【文件属性】：

文件名称：基于残差连接的改进端到端文本识别网络结构

文件大小：1.85MB

文件格式：PDF

更新时间：2024-07-27 00:08:40

端到端网络

针对已有文本识别网络由于深度不够而识别准确率较低的问题，文中提岀一种改进的端到端文本识别网络结构。首先，将文本作为序列，采用残差模块将文本按列切分成特征向量输入循环层。这种残差结枃増加了卷积网络的深度，使网络保持对文本图像的最佳表征能力，实现对文本信息的捕捉。另一方面，残差模块采用堆叠层来学习残差映射，在层数加深的情况下提高了网络的收敛性。然后，采用循环层对这些文本特征序列进行上下文建模，并把建模结果输入 Softmanⅹ层以获得序列对应标签的预测，实现了对任意长度文本的识别。循环层使用长短时记忆网络学习文本之间的依赖关系，解决长序列训练过程中的“梯度消失”问题。最后，通过最优路径方法进行文本标签转录。该方法找到一条路径使其概率最大，并输岀这条路径对应的序列为最优序列。改进的文本识别网络结构増加了深度，提高了文本图像的特征描述能力和在噪声下的稳定性。在多个测试数据集（ ICDAR2003， ICDAR2013，SVT和ⅢT5K）上将所提算法与已有典型算法进行实验对比分析，结果表明该网络结构能够得到更高的场景文本识别准确率，验证了其有效性。

立即下载

秒客网

基于残差连接的改进端到端文本识别网络结构

网友评论

相关文章