基于分割的任意形状场景文本检测下载

【文件属性】：

文件名称：基于分割的任意形状场景文本检测

文件大小：1.14MB

文件格式：PDF

更新时间：2024-05-26 05:46:21

自然场景文本检测分割特征金字塔增强模块特征融合模块可微二值化模块

随着深度学习技术的发展, 自然场景文本检测的性能获得了显著的提升. 但目前仍然存在两个主要的挑战: 一是速度和准确度之间的权衡, 二是对任意形状的文本实例的检测. 本文采用基于分割的方法高效准确的检测任意形状场景文本. 具体来说, 使用具有低计算成本的分割头和简洁高效的后处理, 分割头由特征金字塔增强模块和特征融合模块组成, 前者可以引入多层次的信息来指导更好的分割, 后者可以将前者给出的不同深度的特征集合成最终的特征进行分割. 本文采用可微二值化模块, 自适应地设置二值化阈值, 将分割方法产生的概率图转换为文本区域, 从而提高文本检测的性能. 在标准数据集ICDAR2015和Total-Text上, 本文提出的方法使用轻量级主干网络如ResNet18在速度和准确度方面都达到了可比较的结果.

立即下载

秒客网

基于分割的任意形状场景文本检测

网友评论

相关文章