【摘要】 随着Internet的爆炸性增长,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大动态信息服务网络,为用户提供了一个极具价值的信息源。而传统的信息检索技术不能对这些信息提供语义级的组织、理解以及处理等更能满足用户需求的服务,寻找新的方法成为目前研究的热点。 在现有语义检索方法的基础上,本文针对基于本体的语义信息检索进行了深入的研究,以本体为依据,提出了一种新的语义检索模型,并对该模型涉及的用户查询、文档预处理、语义检索以及检索结果优化等方面,从系统的角度对其中的主要问题进行了分析和研究,主要贡献有: 1.提出了一种基于本体的查询语义扩展方法。 针对现有查询扩展策略缺乏有效的语义处理机制问题,在深入分析现有基于本体概念的查询扩展策略基础上,提出了三种用户查询的语义模式,以及相应的用户查询扩展的方法。该方法利用本体概念连通图以及单词的概念扩展算法对用户查询进行语义扩展,为基于语义的信息检索提供了新的思路。 2.提出了一种基于本体的文档语义标注和语义聚类方法。 针对语义检索中文档表示问题以及文档聚类的语义质心划分问题,提出了一种对文档进行语义标注和向量化处理,以及利用概念连通图中的节点权重进行语义聚类质心划分的方法。该方法在对文档进行语义预处理,并利用文档的实例抽取分析进行语义标注的基础上,为文档建立语义特征向量,并以此为依据对文档进行语义聚类,为文档的组织提供了有效的语义级管理手段。 3.提出了一种基于本体的语义信息检索模型。 针对传统向量空间模型在语义处理方面的缺陷,提出了一种基于本体的语义信启、检索模型,从语义项权重的设计、不同关键字之间的语义关系体现,以及语义特征向量间的相似度计算策略等方面进行了研究。在模型中,通过概念连通图对不同语义项之间的关系进行了重新考量,并将语义相似度的计算分为概念相似度和属性相似度两个方面,综合考虑了二者在语义检索中的作用,改善了检索效果。 4.设计了一种基于频繁语义序列模式挖掘的检索结果优化方法。
【关键词】 本体; 语义信息检索; 查询语义扩展; 语义聚类; 频繁语义序列;
摘要 3-5
Abstract 5-6
目录 7-10
第一章 前言 10-36
1.1 信息检索概述 11-17
1.1.1 传统信息检索基本原理 12-13
1.1.2 信息检索模型 13-16
1.1.3 信息检索系统 16-17
1.2 信息的语义表示 17-22
1.2.1 元数据和信息表示 17-18
1.2.2 资源描述框架及模式RDF(S) 18-20
1.2.3 基于本体的信息表示 20-22
1.3 基于语义的信息检索 22-29
1.3.1 语义信息检索研究现状 22-27
1.3.2 研究的内容及创新 27-29
1.4 论文结构 29-30
参考文献 30-36
第二章 用户查询的语义扩展 36-54
2.1 查询扩展概述 36-37
2.2 查询扩展方法分析 37-40
2.2.1 基于全局和局部分析的查询扩展 37-38
2.2.2 基于词表的查询扩展 38-39
2.2.3 基于语义的查询扩展 39-40
2.3 基于本体的语义查询扩展 40-49
2.3.1 语义查询扩展分析 40-41
2.3.2 基于本体的用户查询分析 41-43
2.3.3 用户查询的语义向量 43-45
2.3.4 用户查询语义扩展算法 45-49
2.4 实验分析 49-50
2.5 本章小结 50-51
参考文献 51-54
第三章 文档的语义预处理 54-78
3.1 基于本体的语义标注 55-62
3.1.1 概述 55-57
3.1.2 基于本体的语义标注分析 57-59
3.1.3 语义标注的流程 59-60
3.1.4 语义实例的标注和抽取 60-62
3.2 文档的语义表示 62-64
3.2.1 文档语义特征向量 62-63
3.2.2 文档语义向量索引 63-64
3.3 基于本体的文档语义聚类 64-72
3.3.1 基于本体的k-平均聚类 65-67
3.3.2 语义聚类的质心划分 67-70
3.3.3 基于语义质心的文档聚类 70-72
3.4 实验分析 72-75
3.5 本章小结 75
参考文献 75-78
第四章 基于本体的语义向量空间检索 78-100
4.1 传统模型与语义模型的比较 79-82
4.1.1 向量空间 79-80
4.1.2 项的权重 80-81
4.1.3 相似度 81-82
4.2 本体的语义 82-88
4.2.1 本体的结构 82-84
4.2.2 本体的逻辑推理 84-86
4.2.3 语义检索的逻辑推理 86-88
4.3 语义相似度的计算 88-92
4.3.1 概念相似度 88-91
4.3.2 属性相似度 91
4.3.3 语义相似度 91-92
4.4 实验分析 92-96
4.5 本章小结 96
参考文献 96-100
第五章 面向序列模式挖掘的语义检索优化 100-118
5.1 频繁序列模式 101-103
5.1.1 基本概念 101-103
5.1.2 序列模式挖掘 103
5.2 频繁语义序列模式 103-108
5.2.1 文档的语义序列分析 104-105
5.2.2 语义序列模式挖掘方法描述 105-108
5.3 基于频繁语义序列的检索结果优化 108-111
5.3.1 用户语义焦点 108-110
5.3.2 语义检索优化
学术论文网Tag: |