大规模定制型制造企业生产车间质量预测
方法研究#
宋光辉,刘颖,谢玉容,魏金江**
基金项目:中央高校基本科研业务费(No. CDJZR10 11 00 14)资助
作者简介:宋光辉,(1985-),男,重庆大学硕士研究生,主要研究方向:网络化制造、车间物流管理、企
业信息化
通信联系人:刘颖,女,重庆大学机械工程学院副教授,主要研究方向:大规模定制、网络化制造、物流
管理. E-mail: lyjfb@sina.com
5 (重庆大学制造工程研究所,重庆 400044)
摘要:针对大规模定制型制造企业生产车间,质量影响因素多且关系复杂以及小样本、贫信
息、不确定问题,提出了粗糙集支持向量机(RSSVM)质量预测方法。它融合了粗糙集和支
持向量机各自的优势,运用粗糙集方法和信息熵概念约简因素属性,优化输入向量维数,然
后输入SVM 对数据集进行训练和预测。实际案例验证表明,与SVM、BP 所预测的结果对比,
10 本文方法具有较高的计算效率和预测精度,证明了该方法的有效性和可行性。
关键词:大规模定制;质量预测;粗糙集;支持向量机
30 0 引言
大规模定制是适应现代化科技发展和用户多样化、个性化需求的一种新的生产模式,它
以大规模生产的成本和速度,为客户提供个性化的产品或服务。企业必须在保证产品的低成
本、高质量的要求的同时,快速响应客户个性化的需求,获得市场竞争力。在大规模定制生
产的环境下,产品质量控制的方法有别于传统的控制工具。根据大规模定制生产的特点,利
35 用质量特性,采取合理的方法预测产品质量,对质量控制具有积极的理论和实际意义。
制造企业生产质量预测问题的研究工作取得了很多成果,在产品设计阶段,提出变化流
法分析和预测产品质量,识别影响生产率等问题的原因[1]。针对生产初期的质量问题,提出
了基于灰数( GM )模型的灰色预测方法[2],质量控制图和灰色预测算法相结合的方法[3],预
测和诊断生产初始阶段故障,减少废品率。提出了在不可靠的多级线中质量和生产控制参数
40 的集成设计方法,在任何生产阶段设置最优参数,进行生产和质量控制[4]。根据小批量、大
规模定制生产中样本小、数据少的特点,提出了适合小批量生产过程的质量智能预测模型[5],
模糊灰色优化质量预测方法[6],基于支持向量机质量预测模型[7],基于动态偏最小二乘法多
阶段在线批量质量预测方法[8]。研究了将各种方法自身优点相结合,提出灰色神经网络集成
建模方法[9],人工神经网络和支持向量机回归模型相结合的方法[10],对生产过程进行质量预
45 测和控制。但这些预测方法要求满足合理的前提,自身存在一些缺点,具有一定的适用范围。
粗糙集理论(Rough Set)[11]作为一种处理不精确、不一致、不完整等各种不完备
的信息有效的工具,不需要预先给定属性的数量描述,能够直接从给定的数据中提取出简
洁、易懂且有效的决策规则,从中发现隐含的知识,揭示潜在的规律,是一种天然的数
据挖掘或者知识发现方法,同时也具有对噪声敏感且泛化能力弱的缺点。
50 支持向量机(Support Vector Machine)[12]是统计学学习理论的基础上发展起来的
一种新的机器学习方法,它是建立在统计学习理论的VC 维理论和结构风险最小化原
则上的,避免了陷入局部极小点,并能有效的解决学习问题,具有良好的推广性能和
较好的分类精确性,在解决小样本、非线性及高维模式识别问题时,具有特有的优势,
是一种优秀的机器学习算法。但支持向量机不能自动简化信息空间维数,当输入数据
55 信息量过大时,输入空间维数较高时,会导致SVM 训练时间长,处理速度慢等问题。
本文针对大规模定制型制造企业生产车间现场质量影响因素多且关系复杂以及小样本、
贫信息、不确定问题,提出了粗糙集支持向量机(Rough Set Support vector machine 简
称RSSVM)质量预测方法,运用粗糙集方法和信息熵概念约简因素属性,优化输入
向量维数,然后输入SVM 进行训练和测试,对生产车间质量进行预测。它将粗糙集
60 的属性约简和支持向量机解决小样本、非线性问题以及泛化能力强等优势结合起来,
提高了计算效率和预测精度,在大规模定制生产车间质量预测方面具有良好的应用效
果。
1 RSSVM 预测模型
1.1 基于粗糙集的特征选择
65 (1)信息知识系统及决策表建立[13]
粗糙集利用信息表来描述论域中的对象,它是一个二维表,每一行表示一个对象,没一
列表示对象的一个属性。S=(U,A,V,f) ,其中U 为论域,是一个非空有限对象集,其中U 为
论域,是一个非空有限对象集,A={a1,a2,L,am} 是非空有限的属性集合,Va 是属性a 的值域,
即= a, :
a A
V V f U A V
∈
U × → 称为信息函数,使得对每一a∈A, x∈U ,有f (x,a)∈Va 。
70 本文中信息表S 由条件属性集C 和D 组成, A=C∪D,C∪D=Φ , C 为条件属性集,
D 为决策属性集, S 称决策表,记为S=(U,C∪D) 。
(2)训练样本属性值特征化
用粗糙集方法进行数据处理时,必须对连续属性值特征化。特征化的方法有很多,如等
距离、等频率、布尔推理、Semi Naive Scaler 算法以及基于Rough 集理论相结合的离散化算
75 法等,可根据实际情况选择其中一种方法。
(3)属性约简[14]
样本属性特征化后确定的决策数据模型仍记为S=(U,C∪D) 。在此利用信息熵概念定义
条件属性重要度,通过属性重要度约简因素。
设
~
C⊆C,
~
U/C上的子集组成的σ 代数上的概率分布为:
( ) ( )
( )
card X
P X
card U
=
,
~
80 X∈U/C. (1)
其中: card(X) 表示集合X 的“势”,X 为有限集合时,表示X 所含元素个数。令:
( ) ( ( ))
~
~
/
ln
X UC
H C P X P X
∈
⎛⎜ ⎞⎟=−
⎝ ⎠ Σ .(2)
称
~
H C ⎛ ⎞
⎜ ⎟
⎝ ⎠ 为条件属性子集
~C
的信息熵。令:
( ) ( ) ( ( ))
~
~
/ /
ln
X UC Y U D
H DC P X PYX PYX
∈ ∈
⎛⎜ ⎞⎟=−
⎝ ⎠ Σ Σ (3)
其中, ( ) ( )
( )
card Y X
P X
card X
∩
=
,称
~
H DC ⎛ ⎞
⎜ ⎟
⎝ ⎠ 为条件属性子集
~C
85 相对于决策属性D的条件信息
熵。称
~
H DC ⎛ ⎞
⎜ ⎟
⎝ ⎠ 提供了决策属性D对条件属性集
~C
的信息依赖性的一个较为合理的度量,
~
H DC ⎛ ⎞
⎜ ⎟
⎝ ⎠ 越大,依赖性越强,否则越弱。设Cj=C−{xj} ,j=1,2,L,n,令:
λ(xj,C,D)=H(DCj)−H(DC),j=1,2,L,n
λ(xj,C,D)越大,说明条件属性或影响因素xj 对决策属性或负荷y 的影响越大,因而越
90 重要。所以λ(xj,C,D)反应了因素xj 在因素集C 中相对于负荷D 的重要度。若λ(xj,C,D)=0,
则因素xj 是冗余的,应从因素集合C 中去掉,因素集C 简化为Cj 。不断计算简化后,因素
集中各个因素的重要度,直至所有因素的重要度大于0,这时便得到约简的因素集,记为C* ,
不防假设为* { }
C = x1,x2,L,xN , 数据样本Ui 对应的支持向量机的输入向量可记作
Xi={xi1,xi2,L,xiN}。
95 1.2 输入支持向量机进行预测
假设有l 个样本数据{xi, yi} ,i= 1, 2,L,l,其中
N
xi ∈R 为N 维样本输入,yi ∈R 为
样本输出,把约简后数据样本输入支持向量机分类器中进行训练和测试,建立质量预
测模型,主要是进行核函数及其宽度、惩罚因子C 以及不敏感系数ε 等参数的选择。
本文利用参数自适应调整的支持向量回归方法进行回归统计。由以下公式计算不敏感
系数 ε 、初始惩罚因子C 和径向基核函数的初始宽度系数100 σ 2 。
ε = 0.5D ,D 为噪声分布函数(随机过程)的方差,在整个迭代过程中不敏感系数ε 保
持不变。
2(0) ( ) ( )
1
1 n T
i i
i
x x x x
l
σ
=
= Σ − − ,式中, l 为样本个数; x 为输入向量的均值,且
1
1 n
i
i
x x
l =
= Σ
105 惩罚因子的初值为
C(0) =2(max(yi)−min( yi))
1.3 RSSVM 预测模型实现流程
图1 给出了粗糙集支持向量机(RSSVM)的计算流程,训练样本数据经过预处理,构建决
策表,然后特征化样本属性,进行属性约简剔除冗余属性和冲突样本,按照参数自适应调整
的支持向量回归方法的具体步骤进行迭代,调整ε 、C 、110 σ 2 ,将处理后的样本输入回归
自适应支持向量机进行训练与测试,最后进行预测并输出结果。
图1 RSSVM 计算流程
Fig.1 The calculation process of RSSVM
115
2 实例验证
将RSSVM 预测方法应用于重庆某门业制造企业油漆生产车间,该防盗门类制造型企业
采用大规模定制的生产模式,客户对定制门的个性化要求很高,不同的订单,要求不尽相同,
一个订单就可构成一次小批量甚至单件的生产流程。产品多样化需求高,致使产品种类繁、
120 规格多。油漆是门产品最后的修饰工作,指用油漆涂饰门面,经过干燥形成一层具有一系列
装饰保护性能的涂膜的过程。其最基本的目的是增加制品的美观与保护材料,延长制品的耐
久性。油漆过程是门类制造企业生产的特殊过程,因此成为质量控制的重点之一。
本文选出2010 年度7 月份油漆车间的生产数据,共2678 条任务。对数据进行兼容性检
查,删除冲突样本和冗余值,剩余的样本数为1834,大大减少了样本数据。从人(操作者)、
125 机(机器加工)、物(物料)、法(方法)、环(外部环境)五个方面[15]来分析影响车间
油漆质量的因素,预测油漆质量。人包括年龄、职称、工作经验等;机包括机器的类型、自
动化水平、购买价格、月平均故障次数等;物包括门和油漆,门的属性包括材质、加工批量、
大小规格、型号、样式等,油漆属性包括油漆的附着性、耐候性、耐磨性、透明度、不脱落
等技术特性以及油漆的档次和是否适用与该门材料等属性;法指目前所采用的加工和制造管
学术论文网Tag:代写经济论文 代写代发论文 代写管理论文
|