首页 新闻中心 中安智能文档影像OCR训练平台上线——自主训练,“养成系”OCR识别来了!

中安智能文档影像OCR训练平台上线——自主训练,“养成系”OCR识别来了!

2022-09-08

  移动互联网时代,人工智能技术在各领域的融合应用不断推进,企业发展到一定规模,组织机构复杂、人员众多、流程复杂,文档识别与结构化数据提取的需求与日俱增,身份证件、企业证照、发票等通用版式的文档识别和信息提取的技术和产品已经比较成熟,应用广泛。

  金融、银行等各类大型企业在日常业务中,还需要应用到一些自有的特定票据和卡证,如外企业开具的收据、财政非税收入专用收据、银行、邮政等部门收费凭据、内部工资表、奖励单、付款单、成本核算资料、实物发放资料等,以上表单在实际企业内部业务及管理流程至关重要,结构化数据提取需求同样迫切,却没有相对优质的解决方案。如采用OCR厂商定制独有模型方案,其定制化成本高、周期长、灵活性差、维护成本高,企业无法灵活自主变更,应用落地开发难,这些因素都阻碍了OCR识别在企业、金融等行业表单管理场景上的应用。

中安倾力打造智能文档影像OCR训练平台

  中安未来结合实际场景需求,倾力打造智能文档影像OCR训练平台,采用全新自主训练模式,可快速定制识别表单/卡证,企业可在该平台自主搭建独有的训练模型,进行独有模版文档的识别和结构化数据提取,极大地减少企业费用成本,提高企业工作效率。

流程极简:自己做“教练”

  中安智能文档影像OCR训练平台,提供模型识别及图像分类器的自定义功能,同时拥有多种预置能力,可与自定义模型配合使用,实现自动分类,识别结果以统一格式结构化输出,支持私有化部署,部署至用户本地服务器,保障数据私密性。

只需简单四步即可完成训练:

01 只需上传模型图片,即可自主制作识别模型,支持自行命名,可通过工具栏进行图像放大、缩小、旋转等操作,实现相同版式图片的结构化识别。1张模型图片,5分钟即可完成模型定制。

02 画出所需训练“标注参考区”字段,自动定位工具可智能、准确定位需要识别区域,避免手动选取不准确导致训练出错。

03 画出“标注识别区”字段,并进行识别信息匹配,匹配完成后进入“开始训练"完成训练后可进行产品测试。

04 测试无误后,选择“发布”,专有表单/证件OCR识别就诞生啦!

诸多优势

  • 自定义分类器

为需要分类的企业独有格式文档,每类上传30张训练图片即可创建分类器,实现对不同版式图片的自动分类。

  • 自定义字段类型

针对输出值为有限集的字段,用户可上传字段词典限制该字段的输出值,系统会进行输出值的智能纠正匹配,提高识别准确率。平台内置丰富的识别核心,用户可设置中文或英文、手写与印刷等识别字段。

  • 内嵌成熟模型

内嵌传统证卡、票据等成熟模型,可直接选择使用,识别率高。

  • 支持倾斜,畸形图像校正

内置强大的图像处理能力,支持倾斜、畸形各式图像校正识别。

  • 银行集中作业

银行在集中运营中心,涉及到大量票据的录入识别,且都为银行专属票据,可通过中安智能文档影像OCR训练平台,自主创建票据模型,批量上传票据影像图片,自动识别分类。

  • 保险投保及理赔

寿险投保中涉及到保单信息录入,使用训练平台识别保单关键信息。

  • 大型企业单据录入

企业在日常业务中涉及各种单据的识别,如ERP信息录入、国药物流行业,需将进项发票及配送单,进行信息识别录入。中安智能文档影像OCR训练平台,用户可自主创建配送单模型,训练发布后即可上传识别。

  中安智能文档影像OCR训练平台的推出,旨在推进人工智能与各领域业务场景的深入融合,推动金融、企业等行业提升全场景信息管理效率的同时,加速OCR技术在各行业的落地进程。