Ontology的研究和应用

来源:互联网 发布:mac excel 只读 编辑:程序博客网 时间:2024/06/09 22:44
Ontology的研究和应用主要包括以下3方面:
        理论上的研究,主要研究概念及其分类,Ontology上的代数;
        信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题;
        Ontology作为一种能在知识层提供知识共享和重用的工具在语义Web中的应用。
Ontology的理论研究包括概念和概念分类、Ontology上的代数。最有代表性的是Guarino等人对概念的分类所做的深入和细致的研究,他们从一般的意义上分析了什么是概念、概念的特性、概念之间的关系以及概念的分类,提出了一套用于指导概念分类的可行理论。基于这个理论,他又提出了Ontology驱动的建模方法,在理论上为建模提供了一个通用的模式。
Guarino的理论可以归纳如下[27]:
概念分类理论的基础是概念的元特性。以概念的元特性为出发点,按照一定的规则,把具有相同元特性组合的概念归为一类,进而给出一般意义上的概念分类体系。概念的基本元特性包括:持久特性、非持久特性、反持久特性、半持久特性、载体标识特性、支持标识特性、外部依赖特性等。表2.1是对其特性的说明:
表2.1  本体概念的基本元特性
Table2.1 Basic meta character of Ontology conception
名称        描述        举例
持久特性        严格定义为: 。
代表某个概念, 代表x是 的一个实例, 表示其后的断言永远为真。        Person具有持久性,而Student不具有持久性。
非持久特性        对某个概念而言,存在某些实例不会永远属于该概念。        Student具有非持久性。
反持久特性        对概念的任何一个实例,这个实例不会永远属于该概念。        Youth具有反持久性。
半持久特性        非持久性和反持久性的差集。        ——
载体标识特性        ——        如Student具有载体标识特性,因为学生之间的区别不是靠学生,而是作为人来区分的。
支持标识特性        每个实例相互之间是可以区分的。        Person具有支持标识特性,人和人之间可由标识(人的指纹)来区分。
名称        描述        举例
外部依赖特性        一个概念对另外一个概念的某种依赖关系。概念A对概念B的外在依赖关系表现为概念A中的任何一个实例a必蕴涵属于概念B的实例b,而b不是a的一部分。        Parent外在依赖于Child,某人的父母蕴涵他(她)有小孩,而他的小孩当然不是他身体的一部分。
Guarino 等人提出的概念分类体系,不仅从理论上澄清了概念分类上存在的模糊和混淆的现象,同时为实际应用中Ontology 概念模型的建立提供了良好的分析、设计和评估的手段。
在信息检索技术方面,可分为3 类[28 ]:全文检索(Text retrieval) 、数据检索(Data retrieval) 和知识检索(Knowledge retrieval)。全文检索的特点是把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求与文件语义上的匹配,这种方式虽然可以保证查全率,但是查准率却大大地降低了。数据检索的特点是查询要求和信息系统中的数据都遵循一定的格式,具有一定的结构,允许对特定的字段检索。数据检索需要有标识字段的方法。数据检索的性能取决于所使用的标识字段的方法和用户对这种方法的理解,因此具有很大的局限性。数据检索支持语义匹配的能力也较差。知识检索强调的是基于知识的、语义上的匹配,因此在查准率和查全率上有更好的保证。目前知识检索是信息检索研究的重点,特别是面向Web 信息的知识检索。
常规的直接基于关键词的信息检索技术已不能满足用户在语义上和知识上的需求,寻找新的方法也就成为目前研究的热点。Ontology 具有的良好的概念层次结构和对逻辑推理的支持,因而在信息检索,特别是在基于知识的检索中得到了广泛的应用[28 ,29 ] 。基于Ontology 的信息检索的基本设计思想可以总结如下:
(1) 在领域专家的帮助下,建立相关领域的Ontology。
(2) 收集信息源中的数据,并参照已建立的Ontology,把收集来的数据按规定的格式存储在元数据库(关系数据库、知识库等) 中。
(3) 对用户检索界面获取的查询请求,查询转换器按照Ontology 把查询请求转换成规定的格式,在Ontology 的帮助下从元数据库中匹配出符合条件的数据集合。
(4) 检索的结果经过定制处理后,返回给用户。
需要说明的是,如果检索系统不需要太强的推理能力,Ontology 可用概念图的形式表示并存储,数据可以保存在一般的关系数据库中,采用图的匹配技术来完成信息检索。如果要求比较强的推理能力,一般需要用一种描述语(如:Loom ,Ontolingua 等) 表示Ontology,数据保存在知识库中,采用描述语言的逻辑推理能力来完成信息检索由于Ontology 能通过概念之间的关系来表达概念语义的能力,所以能够提高检索的查全率和查准率。
目前Ontology 应用在信息检索中的著名项目包括(Onto) 2 Agent、Ontobroker 和SKC 。这3 个项目也分别代表了3 个方向。(Onto) 2 Agent 的目的是为了帮助用户检索到所需要的WWW上已有的Ontology,主要采用了参照Ontology。参照Ontology 是以WWW上已有的Ontology 为对象建立起来的Ontology,它保存有各类Ontology 的元数据。Ontobroker 面向的是WWW上的网页资源,目的是为用户检索到所需要的网页,这些网页含有用户所关心的内容。SKC 是一个正在进行的项目,其目标是解决信息系统语义异构的问题,实现异构的自治系统之间的互操作。该项目希望通过在Ontology 上建立一个代数系统,用这个代数系统来实现各Ontology 之间的互操作,从而实现异构系统之间的互操作。
关于Ontology在语义Web中的应用将在下节中做以阐述。
原创粉丝点击