【摘要】 图像含有比文本更为丰富的信息,在人们日常生活中发挥着重要作用。近年来由于因特网技术的发展及各种消费型电子产品的普及,每天都有巨量的数字图像产生和发布。在多媒体数据库中快速、有效地寻找所需要的图像是一个非常有意义的课题。目前工业界的许多图像搜索引擎(如GoogleTM和百度TM)在搜索图像时并没有按照图像内容本身来搜索,而是根据与图像相关联的文字信息来完成搜索任务。导致搜索结果不尽如人意。基于内容的图像检索是有望解决这一问题的关键技术。本文对这一技术中的几个问题进行了研究,取得了如下结果:纹理特征是图像检索中广泛使用的重要底层视觉特征。本文将图像纹理视为非线性动力系统产生的信号,使用2种非线性信号分析方法-复杂性方法和希尔伯特-黄变换(HHT)方法来提取图像的纹理特征并将之用于纹理图像检索。得出的结果有:(1)将时间序列复杂性方法用于图像纹理分析与检索。所做的工作和得到的结论是:比较了8种时间序列复杂性方法用于图像检索时的性能,发现基于符号动力学和基于熵的方法不适于图像检索;基于频谱分析的CO复杂性特征适于图像检索,该特征的检索性能与二维图像一维化的扫描方法有关;实验表明采用Hilbert扫描方式的CO复杂性特征在Brodatz纹理库上取得了和Gabor特征极为接近的检索结果,计算特征所需要的时间比Gabor特征少了一个数量级;由图像阈值化算法得到启发,提出了一个新的一维时间序列粗粒化框架;提出了多种基于二维CO复杂性测度的纹理特征:复杂度直方图和多尺度复杂度直方图、复杂度共生矩阵、复杂度纹理谱和多尺度复杂性特征;实验表明基于金字塔分解的多尺度复杂性特征在不同的实验图像库上检索性能稳定,是一种较好的纹理特征;(2)将希尔伯特-黄变换方法用于图像纹理分析与检索,所做的工作和得到的结论是:提出了一种新的基于聚类的边界处理算法以改善经验模式分解(EMD)方法所产生的边界效应问题;使用二维Hilbert变换计算了内禀模态函数(IMF)的幅值作为检索用的图像纹理特征。实验表明,提出的HHT特征可以取得和Gabor特征较为接近的图像检索结果。图像的显著性区域是表达图像语义的主要部分。本文尝试使用一个基于视觉生理和心理物理实验基础的选择性视觉注意计算模型用于自然图像检索的研究。所做的工作和得到的结果是:(1)使用视觉注意计算模型计算了图像中的兴趣点并提取兴趣点周围的局部特征用于图像检索。提出的检索特征有图像的显著性直方图特征、图像的显著性标签和注意焦点(FOA)空间关系直方图特征。实验结果表明显著性标签和FOA空间关系混合编码的直方图特征可以取得比全局直方图特征更好的检索结果;在采用视觉注意计算模型计算得到的图像显著性区域上提取的一些区域特征可以取得比全局特征更好的检索结果;(2)提出了将潜在语义标引方法和视觉注意计算模型结合起来用于自然图像检索的方法;(3)提出了在多示例学习框架下基于视觉注意计算模型和JSEG图像分割算法的包生成器方法,并将其用于自然图像检索。图像检索实验表明基于JSEG分割算法的包生成器取得了比一些文献中提出的包生成器更好的实验结果。本文提出了“图像语义阈值”的新概念及其度量方法。通过计算机实验和心理物理学实验初步得到如下结论:在自然图像认知或理解时存在一个语义阈值;可以通过图像的图像熵和图像分维数及类似Weber律的方法来度量该阈值;差别阈限图像及其原始图像的度量值的比值与图像语义内容无关,而和色彩模式(彩色或灰度)及图像的变换方法相关。本文作者还设计与开发成功了一个图像检索实验平台。使用该平台方便了研究者进行图像检索实验研究,提高了工作效率,便于他们之间进行学术交流。这项工作具有一定的应用价值。
【关键词】 基于内容的图像检索; 纹理分析; 视觉注意计算模型; 图像认知阈值; 心理物理学;
摘要 3-5
Abstract 5-7
1 绪论 11-39
1.1 研究背景 11-15
1.2 研究现状 15-37
1.2.1 底层视觉特征 17-22
1.2.2 区域检索和显著性特征 22-24
1.2.3 图像的高维特征约减和索引 24-26
1.2.4 图像的相似性度量 26-28
1.2.5 图像的聚类 28-29
1.2.6 相关反馈 29-34
1.2.7 其他相关的研究工作 34-36
1.2.8 目前存在的问题和发展趋势 36-37
1.3 本文的主要工作 37-39
2 纹理分析的非线性方法及其在图像检索中的应用 39-99
2.1 一维时间序列复杂性与纹理检索 41-72
2.1.1 一维时间序列复杂性算法 47-51
2.1.2 二维图像一维化的扫描方法 51-52
2.1.3 一个新的时间序列粗粒化框架 52-55
2.1.4 一维时间序列复杂性算法与图像纹理分析 55-58
2.1.5 基于一维时间序列复杂性算法的纹理图像检索实验 58-72
2.2 二维序列复杂性与纹理检索 72-87
2.2.1 二维CO复杂性 72-73
2.2.2 二维CO复杂性的一些讨论 73-75
2.2.3 二维复杂度纹理特征 75-83
2.2.4 多尺度分维数 83
2.2.5 基于二维序列复杂性算法的纹理图像检索实验 83-87
2.3 复杂性算法在医学图像检索中的应用 87-90
2.4 希尔伯特-黄变换与纹理检索 90-98
2.4.1 图像的二维经验模式分解 91-93
2.4.2 一种新的基于聚类的边界处理方法 93-94
2.4.3 生成IMF的迭代次数和筛法终止条件 94-96
2.4.4 特征提取 96
2.4.5 基于希尔伯特-黄变换的纹理图像检索实验 96-98
2.5 小结 98-99
3 选择性视觉注意计算模型与自然图像检索 99-128
3.1 视觉注意机制的神经生理基础及其模型 101-111
3.1.1 视觉注意机制的神经生理基础 101-103
3.1.2 视觉注意机制的心理物理模型 103-105
3.1.3 视觉注意机制的计算模型 105
3.1.4 选择性视觉注意计算模型 105-111
3.2 基于选择性视觉注意计算模型的自然图像检索 111-117
3.2.1 图像兴趣点个数的选取 111-112
3.2.2 基于选择性视觉注意计算模型的图像检索特征 112-114
3.2.3 图像检索实验 114-117
3.3 潜在语义标引与视觉注意计算模型在图像检索中的应用 117-121
3.3.1 图像检索中的潜在语义标引方法 117-119
3.3.2 图像检索算法 119-120
3.3.3 图像检索实验 120-121
3.4 多示例学习与视觉注意计算模型在图像检索中的应用 121-126
3.4.1 多示例学习及其算法 121-124
3.4.2 基于视觉注意计算模型的包生成器和图像检索实验 124-126
3.5 小结 126-128
4 自然图像认知阈值的度量 128-154
4.1 图像认知阈值的度量 128-141
4.1.1 图像认知阈值 129-131
4.1.2 图像信息量的计算 131-135
4.1.3 图像视觉复杂性的计算 135-140
4.1.4 语义阈值计算函数 140-141
4.2 图像认知阈值的影响因素 141-147
4.2.1 实验步骤 141-142
4.2.2 使用Weber律计算函数的实验 142-146
4.2.3 使用信噪比计算函数的实验 146-147
4.2.4 结论 147
4.3 心理物理学实验 147-153
4.3.1 方法 148-149
4.3.2 结果与分析 149-153
4.4 小结 153-154
5 通用图像检索实验平台的研制与开发 154-171
5.1 系统总体设计 155
5.2 系统详细设计 155-157
5.2.1 图像检索类谱系树 156
5.2.2 其他设计 156-157
5.3 平台运行界面和运行实例 157-170
5.3.1 用户端程序主界面 157-158
5.3.2 图像库管理 158-159
5.3.3 数据管理 159-161
5.3.4 特征数据库生成 161-163
5.3.5 图像检索和相关反馈 163-168
5.3.6 运行实例 168-170
5.4 小结 170-171
6 总结与展望 171-173
6.1 本文工作的总结 171-172
6.2 下一步的工作 172-173
参考文献 173-194
附录 194-196
致谢 196-197
攻读博士学位期间的科研成果 197
学术论文网Tag: |