计算机视觉的带框手写数字串分割与识别研究(附件)

本文对采集到的银行票据类带框手写数字串进行识别研究,对识别过程的主要问题进行了阐述,重点对框格的剔除问题和数字串分割问题进行了研究。针对线框对于数字串后续处理的干扰,提出了一种基于形态学处理的方法剔除框格,对不同框格适用性较强。针对手写数字串分割问题,从投影法与形态学的角度进行切割算法研究,根据切分情况提出了改进型投影切割等算法,用以提高对于手写数字串的切分稳定性,利用上下轮廓法讨论局部粘连分割。最后利用MATLAB进行了仿真设计,且利用BP算法进行识别验证,测试结果表明了算法的合理性,但算法的可扩展方面还需进一步研究。本文所做设计可针不同框格中的手写对象进行处理,但对于较差样本,例如超框数字的处理与还原能力不足。本文采用了形态学方法和投影法以及上下轮廓法进行分割,应用BP神经网络识别,识别率达62.4%。
目录
摘要 1
关键词 1
Abstract 1
Key words 1
引言 1
1.选题背景 1
1.1 问题的提出 2
1.2 国内外研究状况 2
1.3 研究目的和内容 3
2 开发工具简介及系统总体设计 3
2.1 仿真工具介绍 3
2.2 系统总体设计 3
2.3 仿真图像采集与预处理 3
2.3.1 原图矫正 4
2.3.2 灰度化与二值化 6
2.4 去除框线干扰定位数字串 6
2.4.1 形态学操作与剔除干扰 6
2.4.2 检测图像线缺陷去除线框 7
3 数字分割 8
3.1投影分割方法 8
3.2改进的投影分割方法 10
3.3 形态学分割方法 11
3.4 形态学预处理进行投影分割方法 12
3.5 对于去框后较佳无约束字符的局部粘连情况分割 13
3.5.1 上下轮廓方法处理弯曲较大数字粘连 13
4 基于BP神经网络的带框手写数字串识别 16
5 仿真实验数据分析 17
5.1 实验环境 17
 *好棒文|www.hbsrm.com +Q: ^351916072# 
5.2 实验数据及内容 17
6 总结与展望 20
6.1 总结 20
6.2 不足 20
6.3 展望 20
致谢 20
参考文献: 20
基于计算机视觉的带框手写数字串分割与识别研究
引言
引言
1.选题背景
1.1 问题的提出
阿拉伯数字是人们生活中进行交流必不可少的语言工具,随着一带一路的展开,世界全球化的日益加深,世界各国经济交流越来越频繁,即使有着多种多样的线上手段,线下的大量票务处理、邮政编码、财务报表、银行票据中都需要手写数字识别的应用。如邮件分拣中,大量的信函分拣业务,对分拣自动化中手写数字辨认有了一定要求。而对财政税务金融范畴,包含支票、付款单越来越多。有数据显示在美国各种收缴费中,83%的人更倾向使用纸质的票据,每年产生超过550亿票据量,因此光学字符识别(OCR)技术具备了重要需求,使用手写数字识别技术大大加速了金融业的处理时间,手写数字串识别也成为其中的重要环节[1]。针对今朝手写数字串的录入需求,具有了继续研究的意义与必要性。是以本文对于常见的银行票据类带框手写数字串分割进行研究。
1.2 国内外研究状况
1.2.1 国外研究状况
对于一个识别系统,手写字符串的分割算法正是一个难点,国内外学者对此相关研究。首先识别问题首先出发于OCR系统的建立,1929年德国人先提出其概念,之后美国人也获得了专利随着计算机出现开始获得正式发展,而手写数字的识别则可以看作OCR系统产生后所包含的内容研究中的一类情况[2]。对于其分割方法探索文献[3]提出的是一种轮廓特征(upper/lower contour)分割方法,利用字符串的轮廓分离或确定连接的字符上下轮廓最为接近的点为切分位置。连通域法应用较早且普遍,对于字符信息分布较好且无粘连情况非常有效[4]。出现字符需要切分的情况后,最早使用的递归切分方法[5],利用矩形窗口滑动式不断切分识别,再对后部内容依次处理,但面对字符比划交叉情况该方法仍然收到困难[6]。文献[7]提出一种基于SCP (Significant?Contour?Point )的数字切割方法,通过扫描二值图像得到轮廓链,将轮廓分为波峰、波谷、洞与开放区域的四种区域以此来推算切分点。文献[8]提出的一种增加反馈的切分方法,对于分割后分割子图拼接识别方式增加了将拒绝字符反馈到分割过程以执行错误恢复的方式加强分割成功率。文献[9]使用了储水区(Water Reservoir)概念来切分粘连字符,储水区为从粘连字符上下倒水形成的区域,根据位置分为上中底储水区。依据储水区位置大小确定字符粘连位置,再分析储水区边界和粘连位置与粘连字符形态特征确定切分点[6]。以上内容为外国学者在计算机发展中并行研究的方法。
1.2.2 国内研究状况
国内的起步较晚,我国于上世纪70年代才开始OCR技术研究工作开始对数字、英文字母以及符号进行研究[2]。因此对于手写数字串的研究国内属于后起发力。刘刚等人提出了基于LDP的方法,主要防止非法切分路径出现,下降运算复杂度[10]。张闯等人从国外引入使用的滴水算法(dropfalling),模拟水滴从高向低滴落,只能向下或水平移动,按照重力作用规则选定切分路径[11]。文献[12]使用了基于背景细化的切分方法,根据背景提取特征点包括叉点、端点和角点,然后构造切分路径再评价选择最佳路径[6]。后续进一步改进了上述背景方法,用了一种基于BFA(background and foreground analysis)的数字切分根据前景背景分析,找出特征点考虑了字符多处粘连的情况,计算特征点的混合高斯概率密度,选择最好特点组合连线为切分线[13]。上述三种方法为常用方法,也有研究人员进行改进。在实际应用中,不同情况下不同方法效果不一,例如对于相邻字符间距明显,使用简单直线切分算法能有效分割,但面对倾斜、粘连情况,分割字符串变得困难。文献[14]针对比划较多的字符如汉字识别,提出利用比划作为基元的切分方式,不同于单纯的连通域而采用自底向上策略切分一定程度解决粘连字符切分问题弹不能完全保证基元合并到完整字符中[6]。文献[10]对于几种数字常用切分方法进行的实验表明,基于BFA方法的效果最佳,但是BFA方法复杂度过大,实际应用中不能保证一定程度的即时性。目前对于各种算法,研究人员都在进行改进以应对实际需求,但仍没有确切的较佳方法,对于带框数字串而言情况又将不同。张重阳等人[15]的研究可以看出由于格线在定位与提出之中,会对数字本身产生遮挡笔划丢失等情况,研究仍需选定一种较佳的格线定位方法降低格线对字符串的影响。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wljs/399.html

好棒文