影研AI图文识别解析平台 发布时间:2020-07-30 09:49  作者:真人百家乐  来源:ag真人线上平台  点击:

  OCR识别技术上的缺陷,着重解决识别准确率及识别产生乱码的问题。目前对印刷体文字识别准确率可达

  产品利用业界全新神经网络语言模型,可对全文自由手写文字进行有效识别,有效解决人工判断手写内容存在辨识效率低,辨识困难等情况,识别准确率高于肉眼辨认准确率,高达95%。

  本产品采用条件随机场对文本类型进行区分,根据文字构成情况对文字类别进行结构化预测,如竖版中文、英文、版式等,在识别过程中无需对识别引擎进行切换,实现对手写印刷混合型文字进行有效识别。

  本产品能够基于深度学习技术,利用光学字符识别技术实现多种卡证的识别,无需提前告知卡证的类别,即可进行高效准确的识别,适用于多种卡证同时识别的需求。目前有效支持证件:护照、港澳通行证、台湾通行证、出生医学证明、作品登记证书、商标注册证、税务登记证、不动产权证、增值税卷式发票、飞机行程单、身份证、银行卡、驾照、行驶证、名片、火车票、出租车票、营业执照、EMS快递单、律师证、户籍证、房产证、组织机构代码证、增值税发票等。

  本产品对于表格材料可采用表格分析方法分析表格的逻辑结果,并对表格中存在的文字进行识别,并对识别结果做后处理,保证表格材料识别结果的准确性。

  本产品能够对文本中存在的非文本内容进行提取,如公章(方章、圆章、异形章)、指印、签字、条形码、二维码等,通过对图文内容结构化预测分类,图像内容被分为文字、图形、图像等。对于非文本内容,将该部分进行检出,保证非文本内容的精确检测。

  本产品将深度学习中的卷积神经网络模型应用到文本分类任务中,可对识别材料中各类材料进行自动分类,支持对常用的证件、合同、票据进行类别判断。

  本产品支持对识别结果进行版式还原,能够按照原图片中文字位置、字号、排版、段落、框线还原,大大提升了识别结果的可读性及可用性。

  本产品支持识别结果合成双层PDF文件功能,能够在原图像的基础上,将识别结果覆盖在其上层,应用过程中可直接查看原图像,并可直接在图像文字上进行选中复制等操作,提供了更贴近甚至超越纸质材料的阅读体验。

  本产品支持对识别材料中结构化信息进行提取,包括证件结构化信息及文本结构化信息,支持对结构化信息提取需求个性化定制,目前支持信息提取的证件材料包括:身份证、银行卡、驾照、行驶证、名片、火车票、出租车票、营业执照、EMS快递单、律师证、户籍证、房产证、组织机构代码证、增值税发票等。

  产品在图像存在干扰因素情况下保持高 本产品基于深度学习中的卷积神经网络模型, 本产品基于云计算架构,支持在云平

  准确率,包括但不限于:证件复印件底 可通过样本数据学习,通过特征提取、特征选台上进行能力部署搭建,作为底层能

  纹、证件复印件底灰、文字划线、表格 择,形成对材料的有效认知,进而在短时间内 力,以服务形式为各应用系统提供识

  线、文字上方扣章、版面污损、版面噪 将识别、分类准确率提升至较高水平 别能力,为用户提供信息化支撑

  除常规印刷字体外,还支持手写体文字、 利用自然语言处理技术,可支持文本及证件中 基于深度学习技术可根据需求对识别引

  表格、文字、印章、条码、二维码、证件类结构化信息进行解析提取擎做个性化定制,适用于企业用户的特殊的内容识别材料识别

  北京汉王影研科技有限公司,隶属于汉王集团(股票代码:002362),是业界领先的文档信息化服务提供商、政府外包服务提供商、高端数据服务提供商。在卫生医疗、公检法司、社会保障等领域,影研科技正在为数千家客户提供专业的文档信息系统建设和数据生产交付服务,帮助客户挖掘文档价值并创造效益。

真人百家乐