155 DLT:name ?name) AND (?Technologies1 DLT: Technologes? Technologes)) 1.6 本体查询与应答方式 通过已经定义中介映射将用户在DO 上的查询,拆分成为AO 上的查询。每一个中介映 射可以被解析和重构为一个树形结构。查询ρ(DL:Technologies) = (?DLT DLT:Technologies ? Technologies) UNION (?DLT DOAJ:Technologes? Technologes) UNION ((?DLT JGATE:name ?name) AND (?Technologies1 DLT:name ?name) 160 AND (?Technologies1 DLT: Technologes? Technologes))可以重构为图5 所示的树形结构。 图5 查询p(DL:Technologies)映射树 Fig. 5 Mapping Tree of Query p(DL:Technologies) 165 实际的本体查询处理包括以下三个步骤: ①解析。 首先,将用户提出的DO 上的初始查询,用SPARQL 代数表达式解析和重构为 一个树形结构。 ②展开。通过中介导映射将解析获得的树型结构展开到一个由相关AO 上的子查询构成 170 的新的树形结构,在此阶段每个子查询从AO 中获取结果。 ③优化。优化的主要目的是要找到最合适的树形结构,以便AO 上产生最佳的检索结果, 同时结果数据应尽可能地满足系统处理和网络传输的低成本要求。 2 系统实现 2.1 系统架构 175 原型系统由查询处理模块、本体模块、数据源连接模块、结果处理模块四个部分组成。 (1)查询处理模块 将用户提问通过用户词典处理转换成规范的通用查询语句,查询是全局模式的, 因此, 用户不必关心底层数据源的分布情况和数据模式的差异。 (2)本体模块、 180 接收转换后的通用查询语句, 根据全局本体和局部本体的映射规则对查询进行分解等 处理, 生成面向各个局部数据源的子查询; (3)数据源连接模块 负责连接适配子系统将子查询序列转换成各个数据源所能识别的查询指令; (4)结果处理模块 185 将最终查询结果转换为数据使用者能够识别和使用的文档格式(例如关系型、EDI 格式 或XM L 格式)。 2.2 系统技术路线 (1)用stanford parser 处理词汇表和article 样本,获得概念集。用stanford parser 对ODLIS(2004)文档的词条及其注解进行分析统计,得出了图书情报领域的概念集,用 190 于DO 的构建。选取DOAJ 和OPEN J-GATE 上的40 篇文章样本,从中获取相关概念集, 用于构建AO。 (2)用Protege 构建本体。 (3)对本体进行解析。本体解析有许多思路和工具可以使用,甚至可以自己编写本体 解析的模块。Jena 是由HP 实验室开发的一套API,用于支持语义网应用。它的功能非常 195 强大,可以构建用各种语言(如OWL 、DAML + OIL 、RDFS)描述的本体模型、RDF 模 型。更重要的是,可以使用它内置的推理机(Reasoner)对本体进行推理,也可以与外界 的推理机连接。它作为一个Java 工具箱用于开发基于RDF 与OWL 的语义Web 应用程 序。它提供了一个RDF API、ARP(一个RDF 解析器)、SPARQL(W3CRDF 查询语言)、 一个OWLAPI ,以及基于规则的RDFS 与OWL 的接口[8]。 200 (4)系统基于J2EE 技术实现,数据库采用MYSQL,采用Tomcat 作为web 服务器来 部署系统,用Eclispe 作为集成开发环境。图6 为系统技术路线图。 图6 系统技术路线图 Fig. 6 Technology Path of System 205 2.3 核心代码 系统servlet 负责检索系统的用户请求响应。其代码见图7 图7 系统servlet 类代码 Fig. 7 Code 210 of Servlet in System persistentOntology 类将本体映射到mysql 数据库。 图8 本体持久化代码 215 Fig. 8 Code of Ontology Permanence Sparql 是系统逻辑的核心,系统实现中其功能由有sparql 类完成。代码见图9 图9 sparql 类 220 Fig. 9 Class of sparql 3 结语 本文探索的分布式、异构OA 资源语义检索引擎是以领域本体为基础,以SPARQL 为 核心。所有领域本体上的查询需要在一个应用本体上提交并通过翻译、分解、优化、重构为 225 子查询的组合。通过与DOAJ 和Open J Gate 的检索结果对比分析,该方案取得了较为满意 的检索结果。如图10 所示。 图10 检索结果示意图 Fig. 10 Result of Searching 230 下一步,将通过使用代数化,对查询的翻译、分解、优化等环节进行更为深入的研究。 对检索结果进行更为科学准确的评估。并以中间件开发的形式将实现进行封装,以更为便捷 的方式提供利用。 学术论文网Tag:代写论文 论文发表 计算机论文 代写毕业设计 代发论文 信息系统论文 |