公司动态

首页 公司动态

理解图像处理流程,亿保AI体验中心上线

2021-8-27 07:42| 查看: 439| 评论: 0|原作者: TPA研发部--单齐齐

近日,TPA研发部上线了亿保AI体验中心,展示了TPA研发部在OCR文件识别方面的最新成果,所有研发人员相互学习,深刻理解亿保AI体验中心背后的图像处理流程,还学习了每个图像处理流程的相关算法。截至目前,我们的OCR文件识别已经上线了身份证识别、增值税发票、北京、广东票识别等功能,后续将会上线更多的地区票识别,满足各地区自动识别的需求。

OCR文件识别是亿保健康TPA项目的重要竞争优势之一。目前,许多公司仍依靠人工的方式来识别票据图片中的内容,录入医疗票据类文本,这部分工作需要大量的人力,录入过程耗时过长,效率底下,成本极高。为解决这些公司的这一痛点,我们TPA研发部充分发挥自身技术优势,推出了OCR文件识别。不仅可以通过前端直观地看到每张发票的识别结果,还可以通过接口调用直接返回结果。

OCR文件识别是如何实现的呢?该项目综合运用了图像分类切割、文字检测、文字识别、信息抽取等方法,对医疗票据类文本图片进行数据提取,提高医疗票据类的数据录入的效率与准确度。在具体的算法上,图像分类算法使用了残差网络,同时使用蒸馏的方法减少网络参数,降低处理时间。文字检测算法采用改进的二值化检测网络,将发票分为文本区域和非文本区域,并增加多边形文本框的检测,对拍照场景优化。文字识别方面先使用薄板样条插值算法结合深度学习网络的方法,对矫正参数进行修改,然后对文字进行识别。信息抽取上使用编码解码的网络结构进行实现, 编码模型使用了主流的词向量模型,解码则使用长短期记忆神经网络和条件随机场。最后项目用docker部署到Linux服务器上。

持续不断地创新是保持企业核心竞争力的关键,我们TPA研发部也将坚持创新精神,通力协作,突破一个个技术难关,为公司长久发展提供源源不断的动力。

 

返回顶部