上QQ阅读APP看书,第一时间看更新
2.2.2 图像识别与处理
图像识别与处理功能是指RPA依托OCR(Optical Character Recognition,光学字符识别)技术对图像进行识别,提取图像有用字段信息并输出结构化数据,从而进一步对数据进行审查与分析,将其转化为对管理、决策有用的信息,如图2-3所示。
图2-3 RPA图像识别与处理功能示意图
RPA利用OCR技术对扫描所得图像进行灰度化、降噪、二值化、字符切分以及归一化等OCR识别预处理,在此基础上对文字图像进行特征提取和降维,从而进行文字分类器设计、训练和实际识别。在OCR识别后,RPA进一步对分类结果进行优化校正和格式化,最终使提取的图片关键字段信息输出为结构化数据,由此解决手工录入的问题。OCR技术目前主要应用于对发票信息的识别,可以使财务人员从发票信息识别和录入的机械操作中解放出来,转变成RPA的管理者。
基于OCR技术,RPA可以根据预设的规则,模拟人类的判断,进一步处理任务,对识别后的文字按照预先设置的判断要点、关键信息进行审查和分析,完成从图片到信息的转换与初加工。