vedastr:基于PyTorch的场景文本识别工具箱

时间:2024-04-10 09:04:08
【文件属性】:

文件名称:vedastr:基于PyTorch的场景文本识别工具箱

文件大小:115KB

文件格式:ZIP

更新时间:2024-04-10 09:04:08

ocr pytorch transformer text-recognition ocr-recognition

介绍 vedastr是基于PyTorch的开源场景文本识别工具箱。它被设计为灵活的,以支持场景文本识别任务的快速实施和评估。 特征 模块化设计我们将场景文本识别框架分解为不同的组件,并且可以通过组合不同的模块轻松地构建自定义的场景文本识别框架。 灵活性vedastr具有足够的灵活性,能够轻松更改模块中的组件。 模块扩展性将新模块集成到vedastr项目中很容易。 支持多种框架该工具箱支持多种流行的现场文字识别框架,例如, , ,变压器等。 很棒的表演我们在重新实现了最佳模型,并获得了更好的平均准确性。而且,我们实现了一个简单的基准(ResNet-FC),性能是可以接受的。 执照 该项目是在下。 基准和模型动物园 笔记: 我们使用和作为训练数据,并在 , , , , ,SVTP, 上测试了模型。您可以在找到数据集。 模型 区分大小写 IIIT5k_3000 无级变速器 IC03_8


网友评论