你所在的位置:首页 > 新闻资讯 > 行业新闻

AOI中的OCR算法

行业新闻2019-7-8 21:10:25次浏览


 OCR (Optical Character Recognition光学字符识别)技术,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。

 AOI中的OCR

OCR软件主要是由图像处理模块、版面划分模块、文字识别模块和文字 编辑模块等4部分组成。

1.图像处理模块 主要具有文稿扫描、图像缩放、图像旋转等功能。通过扫描 仪输入后,文稿形成图像文件,图像处理模块可对图像进行放大,去除污点和 划痕,如果图像放置不正,可以手工或自动旋转图像,目的是为文字识别创造 更好的条件,使识别率更高。 

2.版面划分模块 主要包括版面划分、更改划分,即对版面的理解、字切分、 归一化等,可选择自动或手动两种版面划分方式。目的是告诉OCR软件将同 一版面的文章、表格等分开,以便于分别处理,并按照怎样的顺序进行识别。

 3.文字识别模块 是OCR软件的核心部分,文字识别模块主要对输入的汉字进 行“阅读”,但不能一目多行,必须逐行切割,对于汉字通常也是一个字一个 字地辨认,即单字识别,再进行归一化。文字识别模块通过对不同样本汉字的 特征进行提取,完成识别,自动查找可疑字,具有前后联想等功能。

 4.文字编辑模块 主要对OCR识别后的文字进行修改、编辑,如系统识别认为 有误,则文字会以醒目的红色或蓝色显示,并提供相似的文字供选择,选择编 辑器供输出等。

识别方法有三类:相关匹配识别、概率判定准则及句法模式识别。

相关匹配识别法:是根据字符的直观形象提取特征,用相关匹配进行识别。 








2008-2015 © http://www.eyeaoi.com 东莞市宝蓝自动化科技有限公司 版权所有 全国统一服务热线:0769-21987918 总部电话:0769-21987918 邮箱:eyeaoi@163.com