【摘要】 大屏幕多媒体的展示系统越来越多地应用在各种场合,例如科技馆、展览馆等场所,而目前大屏幕人机交互还没有完善的解决方案。手势交互具有交互自然、体验性好等优势,更符合人类交互的的需求,已经成为大屏幕人机交互方案的研究热点。大屏幕人机交互主要涉及三个方面的内容,人机交互时交互人体的跟踪,交互手势的跟踪与识别,以及交互时涉及到的文字输入问题。本文论文主要贡献如下:在物体检测方面提出了一种高斯背景模型快速更新背景机制,利用即时背景差分和高斯混合模型相结合的方法,解决在光线瞬间变化等情况下,高斯背景由于更新背景速度慢,导致前景误检测问题。在人体跟踪方面探讨了基于Meanshift的跟踪算法,针对Meanshift的单一颜色特征和整体目标区域建立模型,在目标尺度变化、光线变化情况下鲁棒性差的问题,提出基于分模块和对每个模块采用纹理和颜色特征建立模型,大大提高了算法的鲁棒性。并探讨了人体遮挡情况下的人体跟踪算法,结合卡尔曼滤波预测算法,在人体完全遮挡的情况下取得了良好的跟踪效果。提出了一种简单的双目视觉定位方法,利用摄像头的投影几何原理和空间直线的关系,避免了传统双目视觉定位的复杂的摄像头标定流程,不利于实际场合使用。在精度不变的情况下,提高了实用性。提出了一种通过识别静态手势,向拼音输入法输入拼音,以达到利用手势向系统输入汉字功能。利用深度图像分割出静态手势,避免了传统RGB摄像头采集手势时,受惯性、背景复杂性以及光照等影响,提高了鲁棒性。在提取静态手势特征上,采用SIFT特征提取方法,既保留了轮廓的各种旋转,缩放不变形,又加强了局部区域特征,提高识别率。手势分类则采用了SVM方法,构造一个多分类树结合汉字拼音的规则,能提供一分钟十个汉字左右的输入方法,可以有效地满足搜索等需要关键字的文字输入需求。在动态手势交互方面,动态手势跟踪利用粒子滤波能够处理非线性目标以及非高斯分布系统的特性,使用粒子滤波算法对手势进行跟踪,获取手势轨迹。传统的粒子滤波在样本重采样过程中,会造成样本的“贫化”问题,本文利用样本周围像素产生样本,利用Hausdorff距离计算个各样本的权值,利用随机平均分布获得随机数,通过周围像素产生的样本获得伪随机样本,解决重采样造成的样本“贫化”问题。得到手势的轨迹,利用16方向角进行离散量化,作为手势识别的输入向量。由于隐式马尔科夫链(HMM)可以同时对空间和时间相关关系建立模型,适用于动态手势识别。传统的HMM初始状态个数是根据经验值,而本文提出一种利用关键点算法对不同的手势初始状态设定不同的值,使得初始状态设定有个参考机制。在选择训练样本时,利用混沌算法,找出训练样本的最优值,使得训练出的HMM模型具有全局最优特性。利用一种阈值的方法,对传统HMM方法进行改进,使得HMM具有一定的拒识率,最大可能地排除输入的错误手势,提高识别率,实验验证了方法的有效性,可以进行人机交互。通过实验可以验证,本文有效地解决了的大屏幕多媒体交互中出现的三个问题,可以使用户在大屏幕人机交互中有较好的,更自然的用户体验。
【关键词】 人机交互; 动态手势; 静态手势; 人体检测; 双目定位;
摘要 3-5
Abstract 5-7
目录 8-11
第一章 绪论 11-22
1.1 引言 11-12
1.2 相关技术研究现状 12-20
1.2.1 运动目标检测 12
1.2.2 人体检测 12-14
1.2.3 人体跟踪 14-18
1.2.4 自然动态手势交互 18-19
1.2.5 静态手势识别 19-20
1.3 本文主要内容与安排 20-22
第二章 人体检测与追踪 22-50
2.1 运动目标检测 22-33
2.1.1 一般检测方法 22-27
2.1.2 基于混合高斯自适应目标检测算法 27-29
2.1.3 改进型的混合高斯模型检测 29
2.1.4 阴影检测 29-31
2.1.5 实验结果与分析 31-33
2.2 运动人体跟踪 33-42
2.2.1 Mean Shift理论 33-36
2.2.2 Mean Shift算法 36-39
2.2.3 基于Mean Shift算法的目标跟踪 39-42
2.3 改进的Mean Shift人体跟踪算法 42-44
2.3.1 人体的分块 43
2.3.2 纹理模型 43-44
2.3.3 改进型Mean Shift算法流程 44
2.4 有遮挡的人体跟踪 44-46
2.4.1 遮挡发生和结束的判定条件 45-46
2.4.2 有遮挡情况下的人体追踪算法流程 46
2.5 实验结果与分析 46-48
2.6 总结 48-50
第三章 基于双目视觉的空间定位技术研究 50-68
3.1 引言 50
3.2 摄像机成像原理与摄像机标定 50-57
3.2.1 摄像机坐标系与世界坐标系 50-53
3.2.2 摄像机成像模型 53-57
3.3 摄像机标定 57-62
3.3.1 摄像机的参数 58
3.3.2 标准摄像机的标定方法 58-62
3.4 一种简单的摄像机双目定位技术 62-66
3.4.1 空间定位原理 63-64
3.4.2 计算空间异而直线公垂线中点 64-65
3.4.3 仿真实验与分析 65-66
3.5 利用双目定位技术的模拟鼠标人机交互方式 66-67
3.6 本章小结 67-68
第四章 基于动态手势的远距离手势交互 68-99
4.1 动态手势跟踪 68-77
4.1.1 基于粒子滤波的跟踪算法 69-75
4.1.2 基于样本加权的粒子跟踪算法 75
4.1.3 实验与分析 75-77
4.2 手势特征提取 77-79
4.2.1 手心位置 77-78
4.2.2 手势方向角 78
4.2.3 手势速度 78-79
4.3 基于混沌训练算法的HMM动态手势识别 79-97
4.3.1 HMM的基本概念 80-82
4.3.2 HMM的基本问题 82-83
4.3.3 HMM基本问题的解法 83-89
4.3.4 HMM状态个数估计 89-90
4.3.5 利用混沌算法改进训练方法 90-91
4.3.6 非典型手势的阈值确定方法 91-92
4.3.7 实验流程 92-97
4.4 本章小结
学术论文网Tag: |