重点推荐省级国家级期刊、北大中文核心、CSSCI、EI、SCI发表,稳妥操作,速度快,包发表。有意向联系客服咨询。
论文代写:十年专业服务品质,全部由期刊编辑、硕士、博士撰写;保证原创、版权归您;保证通过、否则全额退款。
论文发表:与百家优秀期刊合作,代理审核组稿,论文发表涵盖所有专业领域,全部正刊,保证出刊,否则全额退款。
业务合作:因业务发展需要,诚招优秀写手合作,要求硕士以上学历,不限专业,另诚征优秀期刊代理合作,具体详谈。QQ:415835425
BP算法在车牌汉字识别中的应用
BP 算法在车牌汉字识别中的应用
孙茜,李世银*
作者简介:孙茜,(1988-),女,硕士研究生,主要研究方向:通信. E-mail: suncumt311@163.com
(中国矿业大学信息与电气工程学院,江苏 徐州 221008)
5 摘要:由于汉字本身的复杂性,车牌识别系统识别车牌中的汉字比较困难,这已成为我国智
能交通发展的瓶颈之一。针对汉字识别问题,利用学习率可变的动量BP 神经网络学习算法,
应用于智能交通系统对车牌中汉字的识别。通过图片预处理对车牌照片进行分割,提取出汉
字字符作为网络训练的样本,利用样本训练BP 网络,并通过样本集和测试集对网络的识别
能力进行检测,其中样本集识别的正确率是100%,测试集识别的正确率是92.5%,取得了良
10 好的效果。
关键词:神经网络;汉字识别;动量BP 算法;智能交通
中图分类号:TP391
Application of BP Algorithm in Recognition of Chinese
15 Character in License Plate Image
SUN Qian, LI Shiyin
(School of Information and Electrical Engineering, China University of Mining & Technology,
JiangSu XuZhou 221008)
Abstract: Due to the complexity of Chinese characters,it is very difficult to recognize them with a
20 plate recognition system. So it has become one of bottlenecks of China's intelligent transportation
development. In order to solve the problem ,apply the momentum BP neural network algorithm of
adaptive learning rate to recognize characters in transport intelligence system. Separate charaters
from each other with the pretreatment of licence plate images, and extract Chinese characters as
examples to train the BP net.After then,test the ability of recognition characters with sample sets
25 and test sets. Among them,the accurate rate to recognize the samples is 100% and the other is
92.5%.Good results have been achieved in the research.
Keywords: neural network; Chinese character recognition; BP algorithm; transport intelligence
0 引言
30 近年来,中国的经济不断发展。随着物质生活水平的提高,汽车也走进千家万户,而缺
少智能化监管的中国交通也经受越来越大的考验。人们在享受汽车带来的便捷快速的同时,
安全也受到巨大威胁。各种围绕汽车的违法犯罪行为也层出不穷,汽车盗窃、事故逃逸等行
为越来越要求交通系统的智能化。
在大约上世纪八十年代,智能交通在欧美国家就悄然兴起。智能交通[1]是一个基于现代
35 电子信息技术面向交通运输的服务系统。它的突出特点是以信息的收集、处理、发布、交换、
分析、利用为主线,为交通参与者提供多样性的服务。
经历了近二十年的发展,美国等西方发达国家在收费站等地方已实现了基本智能交通系
统的应用,而一些公司也推出了比较成熟的产品。比较实用的产品如[2]-[4]:香港的Asia Vision
Technology 公司、以色列的Hi-Tech 公司、新加坡的Optasia 公司分别研制的VECON、See/Car
40 system、VLPRS 车牌识别系统。VLPRS,VECON 分别是专门以新加坡格式和香港格式的车
牌进行开发的,Hi-Tech 公司研制出能适应多个国家车牌格式的See/Car system,虽然为中国
车牌格式研发的See/Car system 车牌识别系统可对中国的车牌进行识别,但却因汉字本身的
复杂性不能识别车牌中的汉字,所以汉字的识别已经成为中国发展智能交通的瓶颈之一。
本文旨在解决现在中国车牌识别系统面临的最大难题——汉字识别,通过建立一个BP
45 神经网络,用动量BP 算法对中国34 个省市自治区的简称进行学习,最终达到汉字识别的
目的。
1 BP 神经网络
BP 神经网络,即误差反向传播神经网络,利用网络的各级输入、输出之间的误差来调
整各级的权值,直到总误差达到允许范围之内,达到学习的目的[5]。只要有足够多的学习样
50 本,通过BP 网络就能建立一个未知的样本模型,较好地模拟输入、输出间的映射关系。一
般而言,一个三层网络就可以解决绝大部分简单的问题。
图1 BP 网络的三层网络模型
55
1.1 学习率可变的动量BP 算法
动量BP 算法是在传统的梯度下降BP 算法中引入动量因子η (0<η <1),是一种改进
的BP 神经网络学习算法。BP 神经网络每一层的权值向量按下式进行[6]:
( 1) ( ) (1 ) ( )
( )
x k x k E k
x k
η α η ∂
Δ + = Δ + −
∂ (1)
60 x(k +1)= x(k)+Δx(k +1) (2)
x(k)是神经网络第k 次迭代的连接权向量,
( )
( )
E k
x k
∂
∂ 是第k 次迭代的神经网络输出误差
对各权值的梯度向量。动量算法的基本思想是以上一次的修正结果来影响本次的修正量,当
上一次的修正量Δx(k)过大时,
(1 ) ( )
( )
E k
x k
α η
∂
−
∂ 与Δx(k)的符号相反,从而减小本次的修正
量使权值减小。反之,当Δx(k)太小时,
(1 ) ( )
( )
E k
x k
α η
∂
−
∂ 与Δx(k)的符号相同,增大修正量
65 使权值增加。普通的BP 动量算法中的学习率α 是一个常量,在整个学习过程中保持不变,
但是学习算法的性能对于学习率的选择非常敏感,当学习率过大时,算法可能震荡而不稳定;
学习率过小,则收敛的速度慢,训练的时间过长。学习率可变的BP 动量算法增加了一个增
量因子inc k 和一个减量因子dec k ,可以让学习率随着局部误差曲面进行相应的调整:当误差
以减小的趋势趋于目标时,说明修正方向正确,可使步长增加,学习率乘以增量因子inc k ;
70 当误差增加查过事先的设定值时,说明修正过头,应减小步长,学习了乘以减小因子kdec ,
即[6]
( ) ( 1) ( )
( 1)
( ) ( 1) ( )
inc
dec
k k Ek Ek
k
k k E k E k
α
α
α
⎧ + <
+ = ⎨⎩ + > (3)
学习率可变的BP 动量算法较好的解决了传统算法对误差曲面不敏感和收敛速度慢的问
题。
75 2 车牌预处理
在我国,车牌使用92 式[6],一般由一个汉字和6 个字符组成,第一个汉字为全国各省
市或者自治区的简称,车牌中的汉字一律使用黑体。但是由于电子眼等交通图像捕捉设备和
拍摄环境的限制,可能需要识别的图像的效果不好[7],如图像歪斜、不清晰等。所以就需要
通过图像预处理对捕捉图像进行除噪、滤波、校正等,为汉字识别的实际应用打下基础。由
80 于车牌是一系列字符组成的,不可能同时对他们进行识别,所以在汉字识别之前,还要进行
字符分割。本文采用基于边缘检测的二值化分割方法,具体步骤如框图2,
灰度处理边缘检测二值化中值滤波字符分割
图2 预处理步骤
85
1) 灰度处理是把原来彩色图像变为灰白图像,以减少计算量。
2) 利用Roberts 边缘检测算法,对灰度图像进行边缘检测,效果图如图3。
原始图像灰度图像边缘检测后图像
图3 边缘检测效果图对比
90
3) 对图像进行二值化处理。
4) 中值滤波。中值滤波对孤立的噪声点效果较好,可以滤掉车牌上的钉子、污迹等噪
声点,滤波前后对比如图4。
二值化车牌图像
中值滤波后的二值化图像
95 图4 二值化和中值滤波效果图
5) 利用最小二乘法对二值化图像进行字符分割,效果图如图5。.
图5 字符分割效果图
100
6) 预处理完毕,将分割后字符的第一个矩阵以BMP 格式保存,作为下一步训练网络的
样本。
3 利用BP 算法识别汉字
BP 神经网络应用于对车牌中汉字的识别首先要建立34 个省市自治区简称的样本集,包
105 括主要的字形结构特征、字体等以供神经网络学习。典型且完备的样本集可以为网络正确识
别汉字提供很大帮助。接下来就是建立一个BP 神经网络,即便是单层网络,足够多的神经
元也可以实现很复杂的映射关系。理论上来说越多的神经元和网络层对系统越有利,但是在
实际应用中也越复杂。网络建立好就可以运行程序,实现对网络的训练。网络的测试也至关
重要,一个神经网络通常要经过多次修改测试才能符合系统要求。整个车牌汉字识别系统框
110 图如图6。
建立样本集
建立BP网络
训练BP网络
测试BP网络
YES
完成
改变参数
NO
增加样本集
NO
图6 车牌汉字识别流程图
3.1 建立样本集
115 完备、典型的样本集对网络的识别能力至关重要。上节将互联网上车牌的图片经过前期
的预处理,取字符分割七部分的第一部分生成车牌样本集,作为学习样本供BP 网络学习。
由于图片大小不一,所以分割的字符大小也不一样。本文将所有字符均归一化为32×32 像
素的图片。
3.2 建立BP 网络
120 任何一个连续函数均可由一个3 层网络以任意精度逼近[8]。本文建立一个3 层BP 网络,
包括19 个节点(经测试这是本实验的最佳值)。传输函数选择的是对数S 型函数,函数表
达式为
( ) log ( ) 1
1 n a n sig n
e− = =
+ (4)
3.3 训练BP 网络
125 建立BP 网络后对网络进行训练,训练结果如图3。目标误差设置为0.001,训练结果如
图7。
0 20 40 60 80 100 120
10-4
10-3
10-2
10-1
100
101
102
137 Epochs
Training-Blue Goal-Black
Performance is 0.000997811, Goal is 0.001
图7 训练结果
130
3.4 测试BP 网络
网络测试分为两部分,一个是样本集的测试,一个是测试集的测试。样本集的测试是用
训练的样本来测试网络的正确率,测试集是取新的车牌照片来检验网络识别能力。
为了检测网络的直观性和效率,本文采用两种方法来测试BP 网络。第一种是个体检测,
135 提示输入测试样本后,给出归一化分割的图片并显示网络判断样本代号,直观但是效率不高,
需要逐一输入测试集;第二种是批量检测,只需输入测试样本起始和终止文件名,通过编程
自动给出判断正确和错误的数量。 图8 第一种个体检测的结果。
图8 个体检测
140
4 实验结果及分析
样本集测试的出错率是0%,测试集测试的出错率是7.5%。经检验,出错率主要集中在
照片质量较差的样本中,如曝光率太高致使图片预处理时即出现丢失部分字体。本文在实验
学术论文网Tag:代写论文 论文发表 代发论文 论文代写
|
本站郑重声明:
1、我们与数十所知名高校博士强强联手,保持常年稳定合作关系,论文质量更有保证;;
2、写作领域涉及所有专业,实力操作,出稿更快,质量更高,通过率100%;
3、所有代写文章,全部原创,包检测,保证质量,后续免费修改,保证通过;
4、信誉实力服务,专业代写毕业论文,职称论文,硕博士论文,留学生论文,成熟操作;
------分隔线----------------------------