智文——文字识别与智能检索综合应用平台:提供多场景、多语种、高精度的整体文字检测、文字识别和智能检索服务 | 百万人学AI评选

时间:2024-05-31 09:51:20

智文——文字识别与智能检索综合应用平台:提供多场景、多语种、高精度的整体文字检测、文字识别和智能检索服务 | 百万人学AI评选

2020 无疑是特殊的一年,而 AI 在开年的这场”战疫“中表现出了惊人的力量。站在“新十年”的起点上,****【百万人学AI】评选活动正式启动。本届评选活动在前两届的基础上再度升级,设立了「AI优秀案例奖Top 30」、「AI新锐公司奖Top 10」、「AI开源贡献奖Top 5」三大奖项。我们相信,榜样的力量将成为促进AI行业不断发展的重要基石,而****将与这些榜样一起,助力AI时代的”新基建“。

活动官网:https://bss.****.net/m/topic/ai_selection/index

申报地址:http://****programmer.mikecrm.com/WpA03hJ

一、公司简介

一览群智2015年11月6日成立,是国内领先的人工智能公司,以自然语言处理和知识图谱等认知智能技术为基础,为客户提供一站式AI产品和行业解决方案。 公司由北京高校卓越青年科学家文继荣院长领衔、10余名来自微软研究院人工智能知名专家为核心、超过100位来自海内外知名高校或500强企业的研发人员组成的研发团队,研发团队人数占到公司总人数的80%以上,公司每年为科技研发投入的资金都在千万元以上。公司自主研发出智语、智慧、智图、智策四大产品,满足企业在超大规模多源异构情况下的数据治理融合、不同场景下的AI建模,和复杂决策分析需求;让AI技术快速在客户场景落地,打造客户专属的智能决策平台当前,一览群智的产品和解决方案已经成功应用于中国最高人民检察院、中国建设银行、中国邮政储蓄银行、中信银行等近百家机构,极大的降低了AI应用的门槛,帮助客户实现AI落地。2017年,公司获得新毅资本Pre-A轮融资3000万元,2018年,获得经纬中国、策源资本1.5亿元投资。

二、案例详情

产品详情

智文平台是提供多场景、多语种、高精度的整体文字检测、文字识别和智能检索的综合应用平台,平台基于业界领先的深度学习技术,以高精度OCR技术为内核,覆盖文字识别、信息抽取、文件转换到智能检索的OCR应用全流程。
平台支持扫描文件、拍照图片等文件的OCR文字识别,不同于传统的OCR技术,一览OCR以先进的人工智能算法为核心,实现图片旋转校正、正反校正、表格识别、文字颜色识别、文字快分割、文字识别等功能,识别文字包含位置信息,在识别的基础上,返回文字在图片中的位置信息,方便用户进行版式的再处理。
产品主要包括智能识别、智能抽取、智能转换、全能检索几个模块,各模块可独立运行,也可根据业务灵活组合应用。智能识别T提供通用识别和手写识别,支持多种文件格式、多种语言识别,识别准确率高、速度快、特殊处理能力强;智能抽取支持金融国际结算文档信息的抽取、保险文件信息抽取;通用证照如身份证、增值税发票、行驶证等证照票据信息抽取,也支持模板定制化开发;智能转换支持多种格式转换,批量转换、合并转换等;全能检索结合NLP技术,支持语义解析和基于识别实体的高级检索。

技术研发投入

一览群智项目团队定员160人,其中管理人员7人,研发人员120人,财务人员3人,销售人员20人。一览群智通过多年的积累,已经建立起一支由北京高校卓越青年科学家计划项目专家领衔、10余名来自微软研究院人工智能知名专家为核心、超过100位来自海内外知名高校或500强企业的研发人员组成的研发团队,研发团队人数占到公司总人数的80%以上,公司每年为科技研发投入的资金都在千万元以上。

 

三、典型应用场景

1. 图像数据全文检索
对于拥有大量的图片数据的企业,图片内容属于无法检索的信息,查询图片内容时,只能人工浏览查询,或以图片名称模糊检索图片内容,工作量大、效率低下、效果很差。使用智文平台,可以导入批量的图片数据,对图片数据进行全文检索,检索准确高效,很大程度的提高工作效率。
2. 文档电子化
使用通用文字识别技术,实现对各类医疗单据、金融财税票据、法律卷宗等纸质文档的识别,并返回文字在图片中的位置信息以便于进行比对、结构化等处理,可满足医疗、金融、政务、法务、教育等行业文档快速录入、存档和检索的需求,有效降低企业人力成本,提高信息录入效率。
3. 内容审核与监管
使用通用文字识别技术,实现对图像中文字内容的提取,结合文本审核技术识别违规内容,提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景,帮助用户有效规避业务风险。
4. 信息录入与认证
结合OCR和人脸识别技术,实现卡证信息的自动录入,完成用户身份验证。应用于金融保险、社保、O2O等行业,有效控制业务风险。