基于RBF的混沌神经网络的污水量预测
李志华,曾金锋,王晓昌*
基金项目:国家自然基金重点项目(50838005);长江学者和创新团队发展计划(PCSIRT)(IRT0853);
高等学校博士学科点专项科研基金资助项目(200807030001)
作者简介:李志华,(1976-),男,教授,主要研究方向:废水生物处理技术与理论. E-mail: lizhihua@gmail.com
(西安建筑科技大学环境与市政工程学院,西北水资源与环境生态教育部重点实验室,
5 西安 710055)
摘要:【目的】预测短期污水量,为水厂优化运行提供参考。【方法】通过分析某一大型污
水处理厂的水量时间序列的非线性动力学特性,发现该序列具有混沌系统特征,在此基础上
用C-C 法对其进行相空间重构来恢复混沌吸引子,建立了基于RBF 神经网络的混沌神经网络
预测模型,并利用此模型对污水量进行预测。【结果】模拟计算结果表明,该水厂污水量的
10 时间序列具有混沌特性,能用RBF 混沌神经网络进行短期污水量预测。【结论】研究发现,
采用RBF 混沌神经网络可有效地对污水量进行预测,与BP 混沌神经网络相比具有训练时间
短、预测结果稳定且预测精度高的特点。
关键词:市政工程;混沌;RBF 神经网络;污水量;预测
0 引言
35 随着经济的快速发展,城市污水生产量是规划污水系统的布局、配套管网和截污系统的
建设、城市污水处理厂的规模、污水处理工艺的决定性因素,而对于现有污水处理厂的合理
调度和运行费用也有很大的参考价值,因此污水量的预测尤其是短期预测对于污水处理厂的
优化运行具有重要意义。
常用的预测方法包括回归分析法、人工神经网络法和时间序列法等[1,2]。回归分析法和
40 人工神经网络法都是用影响污水水量的各种因素建立模型,不同的是前者通过回归分析法得
到的预测模型,是一种线性预测模型,后者通过神经网络得到预测模型,是一种非线性模型;
时间序列法只利用历史观测污水量序列进行建模。张宏伟等[1]曾用多元线性回归和使用自适
应调整学习率并附加动量因子的梯度下降反向传播算法训练函数的BP 神经网络对城市污水
排放量进行过预测,其实验结果表明两法中BP 神经网络预测效果较好。李利蓉等[3]认为用
45 单一预测方法那一获得足够的预测精度,而用耦合了灰色系统的多元线性回归对某城市生活
污水量进行预测,获得了较高的预测精度。
应用回归分析法和BP 人工神经网络法首先需要确定哪些因素对污水量的产生影响较大
而需要被考虑进模型,哪些因素需要省略。事实上当一些不必要的因素被加进模型后,一方
面会使模型复杂从而增加计算量,另一方面会降低模型的泛化能力[4]。将混沌理论和神经网
50 络相结合可有效地解决上述问题[4]。用混沌方法预测水量必须先对其历史观测时间序列进行
分析,考察其是否具有某种发展规律,以确定是否具有可预测性。虽然影响污水量的可能是
各种各样的众多因素,但混沌理论认为时间序列已经包含了所有影响因素,看似随机却有某
种必然性,只要其中具有某种确定性[5],通过相空间重构的方法恢复奇怪吸引子就可以由历
史观测时间序列预测到未来的水质,而在重构的基础上建立神经网络的预测模型称为混沌神
55 经网络模型。已有学者采用BP 混沌神经网络成功地对水量进行了预测[4]。但一般BP 混沌
神经网络也具有BP 神经网络易陷入局部极小值、收敛速度慢等缺点,而RBF 混沌神经网
络能较好的克服这些缺点,因此本文将就RBF 混沌神经网络预测进行建模,并将其预测结
果与使用改进优化算法的BP 混沌神经网络[4]对于污水量的预测进行比较。
1 混沌神经网络模型
60 用神经网络进行预测的过程中,输入层的神经元个数难以确定,即难以决定对污水量起
决定性作用的影响因素个数,而对于混沌特征的动力学系统来说,对混沌时间序列的重构能
够恢复混沌吸引子,从时间序列数据中提取和恢复原来的规律[6]。在这个过程中所得出的嵌
入维数恰能作为神经网络的输入个数,因此在混沌理论的基础上建立的神经网络预测模型具
有更高的可信度。
65 混沌神经网络的预测方法包括以下几个步骤:
(1) 对原始观测数据进行相空间重构 ;
(2) 在相空间重构的基础上计算最大Lyapunov 指数以判断是否具有可预测性;
(3) 如果具有可预测性,则在相空间重构的基础上构造神经网络预测模型;
(4) 将重构后的数据分为训练集和预测集,将训练集数据进行训练,达到目标后将
70 预测集依次输入,此时可得到预测值。
1.1 相空间重构
相空间重构的目的是确定神经网络的输入数据和网络结构,在改过程中通过计算最大
Lyapunov 指数以判断是否具有可预测性。假设历史观测的数据时间序列为{X(t),t = 1,
2,…,N } ,则根据Packgrd 等人和 Takens[7]提出的理论可以通过时间延迟的方法构造一
75 个m 维相空间:
Y(t)= {X (t) ,X(t + τ) ,…, X(t + (m-1)τ)} , t = 1,2,…,M (1)
其中m 是嵌入维数,τ 是延迟时间。N、m、τ、M 四者的关系为:
M =N -(m-1)×τ (2)
确定m 和τ 的方法有很多,可分别用自相关法[8]、平均位移法[8]、复自相关法[9]和互信
80 息法[10]等选取τ,用几何不变法、虚假最临近点法(FNN)或CAO 方法选取嵌入维数,也
可以用时间窗长度、C-C 法或微分熵比方法同时确定m 和τ。本研究用Kim 等提出的C-C
法同时确定m 和τ[11]。C-C 法的优点[5]在于抗噪音能力较强、适合小数据量及计算量小,其
计算计算步骤简单介绍如下[11]:
(1) 求出观测历史时间序列的标准差σ
85 (2) 计算以下三个量:
5 4
2 1
1 ( , , )
16 j
m j
S Sm r t
= =
= ΣΣ (3)
5
2
( ) 1 ( , )
4 m
S t S m t
=
Δ = ΣΔ (4)
cor ( ) ( ) S = ΔSt+St (5)
式中,
, 1,2,3,4
j 2
r j j σ
90 = = (6)
5
2
( , , ) 1 [ ( , , ) m(1, , )], 2,3,4,5
j s j s j
m
S m r t C m r t C r t m
t =
= Σ − = (7)
( , ) max{( ( , , ))} min{( ( , , ))} j j ΔS m t = S m r t − S m r t (8)
1
( , , ) 2 ( )
( 1) i j
i j M
C m r t H r x x
M M ≤ ≤ ≤
= − −
− Σ (9)
H(r)=0(r<0)或(1 r≥0) (10)
95 步骤(2)中的公式(3)、(4)、(5)综合反映了观测序列的相关性程度,为了保证
相关性的可信度同时又不过多增加计算量,需选一个合适的数据量进行相关性分析。
(3) 取ΔS(t) 的第一个极小值作为时间序列观测的第一个局部最大值,此值对应的
时间为最优延迟时间τd,同时找到cor S 对应的全局最小值,此值对应的时间为时间窗口长度
τw,此时就可以得到嵌入为数w 1
d
m
τ
τ
= + 。
100 1.2 计算最大Lyapunov 指数
通过以上计算可以确定延迟时间τd 和嵌入维数m,在此基础上可以对研究对象进行相
空间重构,并计算Lyapunov 指数,从而判断观测时间序列是否具有混沌特性。一般在实际
应用中,并不需要计算时间序列的Lyapunov 指数谱,而只需要计算其最大Lyapunov 指数
即可。只要观察最大Lyapunov 指数是否大于0 就可以判断一个时间序列是否是混沌系统。
105 因为wolf 法计算最大Lyapunov 指数需要数据量较大、计算结果受各种参数的影响也较大而
且实现困难,所以选择Rosenstein 等提出的小数据量法[12]。
时间序列进行重构后,对重构后的轨道每一个点j Y 寻找最近的邻域
学术论文网Tag:代写论文 代写代发论文 论文发表 职称论文发表
|