文件名称:mmocr:OpenMMLab文本检测和识别工具箱
文件大小:5.96MB
文件格式:ZIP
更新时间:2024-04-28 09:58:26
ocr deep-learning pytorch transformer db
介绍 MMOCR是基于PyTorch和mmdetection的开源工具箱,用于文本检测,文本识别以及相应的下游任务,包括关键信息提取。 它是项目的一部分。 master分支可与PyTorch 1.5+一起使用。 文档: : 。 主要特点 综合管道 该工具箱不仅支持文本检测和文本识别,还支持其下游任务,例如关键信息提取。 多种型号 该工具箱支持用于文本检测,文本识别和关键信息提取的各种最新模型。 模块化设计 MMOCR的模块化设计使用户可以定义自己的优化器,数据预处理器和模型组件,例如主干,颈部和头部以及损失。 有关如何构建自定义模型的信息,请参考 。 众多实用程序 该工具箱提供了一套全面的实用程序,可以帮助用户评估模型的性能。 它包括可对图像,地面真实情况以及预测的边界框进行可视化的可视化工具,以及用于在训练过程中评估检查点的验证工具。 它还包括数据转换器,以演示如何将自己