【摘要】 随着网络的发展,信息数量激增但缺乏结构性,使得用户查找所需知识、系统呈现相关信息以及专家维护信息系统的难度都大大增加。基于此,通过建立本体并高效地实现本体的共享从而实现对信息、知识的共享和重用为越来越多的学者所关注并成为相关领域学者研究的热点。现实中,不同领域甚至同一领域中往往存在多个异构本体,能够运用于所有本体并真正实现本体共享的方法与系统并不多见。本体映射通过建立异构本体间的语义关系并输出概念、属性等映射对来实现本体间的重用和互操作。中文资源是全球知识与信息网络的重要组成部分,实现中文本体间以及中、外文表示的本体间的映射是实现本体共享、重用的一个重要方面。目前针对本体映射的研究有很多,但在众多的映射方法和系统中,对中文本体间以及对中、外文本体间进行映射处理的仍非常有限,而且有些映射系统在运行时并不考虑跨语言本体之间产生的语义上的歧义。本文致力于WordNet和《中国分类主题词表》的映射研究,旨在扩大《中国分类主题词表》的词汇量,从而为实现中文本体间的映射提供一个映射的标准与基础,使得中文本体间的映射更加准确并且更能体现中文的结构和特点。本文采用了中文WordNet和Web版的《中国分类主题词表》,其中《中国分类主题词表》并不是一个标准的本体,但其具有类似于本体的特征,比如包含大量的词汇、具有语义特征。文章首先通过Protege用本体语言OWL对《中国分类主题词表》进行描述输出,转换为本体的标准形式,其次对二者进行本体预处理并通过虚拟文档的建立提取出候选映射对,然后利用HowNet(知网)来实现二者概念、属性以及实例等在元素和结构层面上的语词相似度计算,并选取出最终的映射对。文章最后通过实验分析证明了本文提出的映射方法的有效性。 中文摘要 8-9 ABSTRACT 9-10 第一章 绪论 11-16 1.1 研究的背景和意义 11-13 1.2 本体映射研究状况述评 13-14 1.2.1 国外研究现状 13 1.2.2 国内研究现状 13-14 1.3 论文研究内容与章节安排 14-15 1.4 论文创新之处 15-16 第二章 本体映射及其算法与系统 16-29 2.1 本体以及本体异构 16-20 2.1.1 本体的定义和本体异构的产生 16-17 2.1.2 本体异构的种类 17-19 2.1.3 解决本体异构的方法 19-20 2.2 本体映射 20-23 2.2.1 本体映射及其过程 20-21 2.2.2 相似度与本体映射函数 21-23 2.3 目前常用的本体映射方法与系统 23-29 2.3.1 本体映射方法的理论研究 23-26 2.3.2 本体映射原型方法及系统 26-29 第三章 WordNet和《中国分类主题词表》的映射模型构建 29-52 3.1 WordNet、《中国分类主题词表》与HowNet 29-36 3.1.1 WordNet 29-31 3.1.2 《中国分类主题词表》 31-33 3.1.3 HowNet 33-35 3.1.4 选用三种本体词典进行映射的意义 35-36 3.2 映射模型框架设计 36-37 3.2.1 映射模型设计目标 36 3.2.2 映射模型模块设计 36-37 3.3 《中国分类主题词表》的本体形式转化 37-40 3.3.1 词表与本体的比较与融合 37-38 3.3.2 《中国分类主题词表》的本体转化 38-40 3.4 基于树结构的本体预处理 40-41 3.5 基于虚拟文档的映射对选取 41-42 3.5.1 虚拟文档的建立和相似度计算 41 3.5.2 映射的发现 41-42 3.6 基于知网的多策略词汇语义相似度计算 42-51 3.6.1 相似度测量规则 42-45 3.6.2 基于知网的词汇相似度计算方式 45-46 3.6.3 已收录词汇相似度计算策略 46-50 3.6.4 未收录词汇的相似度计算策略 50-51 3.7 映射对的选取 51-52 第四章 实验及结果分析 52-55 4.1 实验 52-54 4.1.1 评估标准 52 4.1.2 实验数据 52-54 4.2 实验分析与改进 54-55 第五章 结论与未来工作 55-57 参考文献 57-60 攻读硕士学位期间取得研究成果 60-61 致谢 61-62 个人简况及联系方式 学术论文网Tag:代写硕士论文 代写论文 代写图书论文 |