广义数据场及其在人脸表情识别中的应用 王树良1,李英2,谢媛1* 基金项目:国家973计划(2007CB310804);中国自然科学基金(60743001) 作者简介:王树良(1975-),男,教授,主要研究方向为空间数据挖掘. E-mail: slwang2005@gmail.com (1. 武汉大学国际软件学院,武汉 430079; 2. 武汉大学测绘遥感信息工程国家重点实验室,武汉大学 430079) 5 摘要:为了更好地估计数据场势函数,本文提出广义数据场势函数估计,并且以人脸识别为例进行研究。数据场是根据物理场的思想理解和描述数据特点。鉴于在多维空间中目前存在的势函数的不足,把影响因子各向同性变为各向异性,使数据场进一步扩展为广义数据场。对于势函数估计的精度,其好坏主要取决于影响因子,而单位势函数的选择并不太重要。人10 脸的表情丰富多样,变化不定。不同的表情脸其实就是人脸不同部位作用程度不同的结果。本文利用JAFFE表情脸图像库进行实验,整体识别率高达94.3%。结果证明,该方法能够较有效地识别人脸。 关键词:计算机应用技术;数据场;影响因子;人脸识别 中图分类号:TP391.4 15 0 引言 海量计算机数据集已经远远超过人类完全理解和使用的范围[1]。数据获取、传输和存储的快速进步导致计算机数据集急剧膨胀,这些数据在属性深度和实例对象范围这两方面持续40 增加和积累。为了充分利用数据仓库的优势,有必要提出一些新的方法来发现对象数据集的本质。 数据集中的数据表示对象的属性数据,在数据空间中相互作用。法拉弟首先提出场的概念,用其描述对象间的相互作用,其中每个点的势值代表场源强度。场是物质存在的基本形45 态之一,任何实物粒子都不可能脱离有关的场而单独存在[2]。空间中以不同的形式存在各种场[3] 。在核力场中,核子力出发或终止于场源,势值随着距离的增加急剧减小到零。在原子核子中,一个核子产生一个中心力场。通过模拟核力场,在整个空间中形成数据场,用数据场描述数据间的相互作用[4]。在多维数据场中,当数据在不同方向上有不同的变异性,或数据几乎位于一个低维流形上时,认为各个方向都有同样的尺度得到的估计往往不太理想。 50 人脸识别技术是利用已存储在数据库中的人脸数据识别某个场景中一个或多个人[5] [6] [7] 。具有高识别率的典型方法包括特征脸法[8],脸部重要器官的几何特征法[9],关联度法[10],线性判别法[11],隐马尔可夫模型方法[12],神经网络法[13],奇异值分解法[14] [15],和基于自动模型构建的脸部跟踪法[16]。人脸识别的发展加速了它的应用并且为神经科学家和心理学家的工作提供了便捷[17] [18] [15] [16] [5]。然而,人面部表情的复杂性给人脸识别带来了的不确定性55 使得提取和识别表情特征仍然存在一定的困难。 因此,对于多维数据场,为了得到更好的数据场势函数估计,本文提出了广义数据场势函数估计,并在人脸特征提取和识别中得到应用。在以下几部分中,第2部分介绍了广义数据场的基本概念,而第3部分阐述了基于广义数据场的人脸识别原理。在第4部分中,通过实验证明基于广义数据场的人脸识别算法是有效的。最后,第5部分是结语。 60 1 广义数据场 在这部分中,通过在多维空间中把影响因子各向同性变为各向异性,数据场进一步延伸为广义数据场。假定密度函数和数据集是已知的,则势函数估计的精度主要取决于影响因子65 和单位势函数。 1.1 数据场定义 空间pR 中包含n个对象的数据集nXXXD,,,21,其中70 niXXXXipiii,,2,1,,,,'21。认为每个对象具有一定质量的质点或核子,其周围存在一个作用场,位于场内的任何对象都将受到其它对象的联合作用,由此在整个空间上确定了一个数据场。 数据场中任一点x的势值可以表示为 niiiXxKmx1 (1) 其中xK为单位势函数,满足1dxxK0dxxxK。为影响因子。0im为75 对象iX的质量,假设满足归一化条件,即有11 niim。如果每个对象具有相等的质量,由此可以得到简化的势函数公式,即 niiXxKnx11 (2) 在多维数据场中,整个数据场中的势函数估计(1)中影响因子 在不同维上取值相同,这意味着每个观测数据点的能量分布向各个方向均匀散开。但是通常情况下,不同维的数据80 具有不同的属性。 应当是各向异性的,即 的取值在不同方向上是不同的。此外,当数 据在不同方向上有不同的变异性,或数据几乎位于一个低维流形上时,认为各个方向都有同样的尺度得到的估计往往不太理想。因此,在多维数据场中,为了得到更好的数据场势函数估计,定义广义数据场势函数估计为 niiiXxHKmnx111 (3) 85 其中,H为与影响因子有关的pp正定常数阵。为了方便,取AH,其中0,1|A|。 势函数K为实值多维数据场势函数。为了便于计算,取H 为正定三角矩阵,基于(3)式的一种简化势函数估计定义为 nipjjijjiXxKmnx111 (4) 其中j为第j维的影响因子。例如,如果数据对象是二维的,则, j=1, 2。 90 1.2 影响因子最优化 当单位势函数固定,值很小时,对象间的相互作用力程很短,x等价于n个以数据对象为中心的尖峰函数的叠加, x有较大波动。反之,如果 值很大,对象间的相互作用95 很强,x成为n个变化缓慢且宽度很大的单位势函数的叠加,每个对象周围的势值比较大,极端情况下,每个对象所处位置的势值近似相等,使得某些特征被隐藏。因此,影响因子的选取应使数据场势值分布尽可能地体现底层数据的内在分布。 为了更好地理解数据场势函数估计量的好坏,首先在一维空间中应用积分均方误差,然后可以直接推广到p维数据场。 100 取dxxffR2,022dxxKxK,则积分均方误差为 dxxfxEMISE2 (5) 通过计算可得渐近积分均方误差为 4442KRndxxKAMISEK (6) 关于最小化AMISE可得 105 51"4 fRnKRKopt (7) 由于"fR未知,很多估计影响因子的方法依赖于优化或找到关于的函数的根。 具体的计算方法很多,如Silverman的大拇指法[19]、Sheather-Jones插入法[20] [21]、极大光滑原则[22]、 交叉验证[23]等。取相同的单位势函数,分别用不同的方法进行估计,如图1所示,其中红线代表原函数,蓝线代表势函数估计函数。 110 (1)大拇指法 (2)Sheather-Jones插入法 (3) 极大光滑原则 (4) 似然交叉验证 图1 原函数(红线)和势函数估计函数(蓝线) 从图1中可以看出,Sheather-Jones插入法和似然交叉验证表现较好,但倾向于过度光滑, Silverman的大拇指法和极大光滑原则倾向于光滑不足。 115 对于广义数据场,同理可得渐近积分均方误差为 dxASACndxxKAMISExTKptr22424 (8) 关于k和A最小化AMISE,得到 42442444244min141 ppxTAppppkpoptdxASAtrdxxKpCAMISEn (9) 120 41222)(minpxTAkoptdxASAtrnCdxxKp (10) 其中xS为f的Hessian矩阵。 图2显示了对一组二维数据分别用Silverman的大拇指法、交叉验证、Sheather-Jones插入法和极大光滑原则进行估计。 (1) 原函数 (2) 大拇指法 (3)Sheather Jones插入法 (4) 极大光滑原则 (5)似然交叉验证 图2 AMISE和影响因子 125 由图2可知,在广义数据场中,大拇指法和似然交叉验证方法倾向于光滑不足,而Sheather-Jones插入法和极大光滑原则倾向于过于光滑。光滑不足致使估计得到势函数有很多错误的峰值,而过于光滑致使一些重要的特点被光滑掉。在实际应用中,我们只需要对影响因子试一串值,然后选择一个合适的值。 130 1.3 单位势函数的选择 在一维数据场中,当影响因子固定时,由(6)、(7)知 51"5145minfRnKRAMISEK (11) 对于不同的势函数21,KK,要保持同样的最小值,则 135 121212KRKRnnKK (12) 成立。在广义数据场中,同理由(9)可得(12)式。因此,(12)量了 1 2 K ,K 的渐近相对效率。通过计算可得 11212KRKRKK (13) 由(13)式可知,单位势函数的选择并不重要。 140 以一维数据场为例,关于同一组数据,我们选取不同的单位势函数K和L,用大拇指法对数据场势函数估计,比较结果如图3所示。 (1)单位势函数K (2) 单位势函数L 图3大拇指法取不同单位势函数时的估计结果 145 由以上分析可知,势函数估计的好坏主要取决于影响因子,单位势函数对数据场势函数估计影响比较小。因此,相对于影响因子而言,单位势函数的选择显得并不太重要。一般地,在多维空间中,数据场具有各向异性,即不同维上的数据具有不同的属性。这种异向性需要通过在不同维上选取相应的影响因子来描述。 150 2 广义数据场在人脸识别中的应用 人脸识别是模式识别中的一个难点。人脸的表情丰富多样,基本上是通过眼睛、眉毛、嘴巴,甚至鼻子、细微的脸部肌肉变化来实现的。因此,表情脸可以看作是这些部分的复杂组合,不同的表情脸其实就是这些组合元素不同作用程度的结果[2]。 155 2.1 人脸图像数据场 给定sr像素的人脸灰度图像srA,若将每个像素点视为二维空间中的一个数据对象,像素点的灰度jiA,ij视为数据对象的质量(假设灰度值ij已归一到[0,1]区间),160 其中,sjri,,1,,,1,则所有像素点在二维图像空间中的相互作用就可以确定一个人脸图像数据场。为了计算方便,记srn,即共有n个像素点。将像素点的坐标写成一个数据集nXX,,1,其中21,iiiXXX,21,iiXX分别为某一像素点的横坐标和纵坐标,即TnTTsrXXX,,,2,1,1,121。将二维灰度矩阵srA写成一维向量Tnmmmm,,,21,其中rsnmmm,,,122111。根据数据场的势函数公式,165 场中任一点21,xxx的势值可以计算为 n1211ijjijjiXxKmnx (14) 其中21,分别为数据中第一维和第二维的影响因子。由于横坐标和纵坐标具有相同的尺度,则21,取值相同。 学术论文网Tag: |