・192・ 计算机应用研究 2006焦 扎龙湿地保护领域本体的设计与应用研究 邢军 一,周开朋 ,韩敏 (1.大连理工大学电子与信息工程学院,辽宁大连116023;2.大连轻工业学院,辽宁大连116034) 摘要:通过对扎龙湿地保护主题进行需求分析,建立起资源对象的输入/输出需求驱动模型,并结合国内外本 体的创建与开发方法构建湿地保护领域本体;阐述了该本体在湿地实际研究中的两个应用。 关键词:领域本体;湿地保护;驱动模型;概念;关系 中图法分类号:TP301 文献标识码:A 文章编号:1001—3695(2006)12—0192—03 Research on Design and Application of Domain Ontology of Zhalong Wetland Protection XING Jun .ZHOU Kai-peng ,HAN Min (1.College ofElectronic&Information Engineering,Dalian University ofTechnology.,Dalian Liaoning116023,China;2.DallanInstituteof tight Industry,Dalian Liaoning 1 16034,China) Abstract:Through the analyzing on requirements of the Zhalong Wetland Protection,the drive model is completed which is based on the inputs and outputs of resources.Domain ontology is created combing the methods at home and abroad.And two applications about the ontology in wetland domain have been described in this paper. Key words:Domain Ontology;Wetland Protection;Drive Model;Concept;Relation 近年来,由于火灾、水灾、围垦、水质的污染等破坏因素的 发的方法。 频繁发生,使扎龙湿地面积和鹤类数量明显减少,生物多样性 本文采用的湿地领域本体模型是参考借鉴了METH本体 遭到破坏,严重危胁着扎龙湿地的生态环境。针对湿地的现 方法。通过对湿地保护领域进行需求分析后,首先构造湿地资 状,分析湿地资源遭受破坏的原因、找到应采取的保护措施,已 源对象的输入/输出驱动模型,收集与湿地保护相关的大量概 成为扎龙湿地生态保护的首要任务。 念和术语,分类生成驱动模型中的各个知识集,并经过不断地 本体技术的发展与应用为调查湿地资源及进行湿地领域 精简、提炼、补充修改建立起来的。湿地领域本体的建立过程 专项研究提供了一条新的途径。将本体技术应用到湿地领域 主要包括:①根据对湿地领域的需求分析,建立在需求驱动下 中去,通过对湿地资源对象进行需求分析并建立相应的驱动模 的输eL/输出模型,分析出输入、对象、结果。这部分实质上完 型,进而创建湿地保护领域本体,确定湿地领域中的概念及概 成了湿地领域本体基本框架的构建且收集了大量的概念和术 念之间的关系,达成人fffJ>xf湿地保护的共识,对指导湿地的合 语。②在已有的本体框架下利用相关的概念和术语逐步具体 理开发、利用及保护都具有较强的现实意义。 地建立了湿地本体。这部分实质上完成了对湿地中概念和概 1 湿地本体建模、设计与实现 念之间关系的确定、本体编码及形式化。这种领域本体的构建 方法既有通用的方面,也有湿地保护领域的自身特点,很符合 尽管本体的功能已经被认识,并逐渐得到应用,但目前 人类的思维认知,且逻辑性强,具有极强的可操作性以及可拓 本体的开发还没有统一的标准,不同的应用和工程所遵循的创 展性,可以被一些领域本体在建立时采用。 建过程和方法 不同。国外主要有KBSI在lICE项目提出 1.1 湿地输入/输出需求驱动模型 的IDEF5方法;Uschold和King等人在Enterprise项目提出的 对于湿地保护主题来说,可以把湿地保护问题分解为:输 骨架法;Gruninger和Fox等人在TOVE项目提出的基于场景的 入条件、处理对象、输出结果三个部分,也就是湿地干扰因素、 方法;Fernandez和Gomez等人在CHEMICALS项目提出的 湿地资源对象及引起的湿地生态特征变化。我们称这种模型 METH 本体方法等。国内主要有陆汝钤院士等人在Eagle等 为输入/输出需求驱动模型,即一个问题的产生、分析、最终得 项目中提出的基于生物种群进化的方法 。在具体的应用 到解决问题的方法应该具有的知识范畴的分解。如图1所示, 中,应该根据各领域应用的特点来选择和借鉴具体的创建和开 在模型框图中湿地破坏因素和湿地保护措施为模型的输入,处 理对象为某一类型湿地中的某一资源,湿地破坏因素作用于对 收稿日期:2005.09—17;修返日期:2005—11—13 象产生负面的生态特征变化,而采取的保护措施产生正面的生 基金项目:国家自然科学基金重点资助项目(50139020) 态特征变化,分别对应于图1中的上下两个流程。 维普资讯 http://www.cqvip.com
第12期 邢军等:扎龙湿地保护领域本体的设计与应用研究 ・l93・ 根据应用需求建立对象驱动模型后,逐一考虑描述这种对 象驱动模型所依赖的概念及概念之间的关系,也就是建立湿地 领域本体。扎龙湿地保护相关的知识集是通过走访大量的领 域专家,查阅扎龙湿地相荚的报告、书籍、文献 l_、网站并结 合本研究小组实际做的湿地项目得到的。根据湿地保护对象 其他的一 关系(~对一、一对多和多对多),例如鸟类继承了 动物的所有属性,隶属于动物及动物上层的概念。 (4)生成湿地模型中的对象相关的词汇集合。将保护领 域中的所有概念构成一个概念术语集合,将所有的概念的属 性构成属性术语集合。 驱动模型,知识集可分为湿地类型模型、湿地资源模型、湿地破 坏因素模型、湿地保护措施模型及湿地生态特征变化模型等五 (5)精简蒯汇集合中的词汇。 (6)在(3)一(5)的基础上,扩充关系集合R,确定知识 部分知识集,如图2所示。 化 湿地生态特征变化模 集}l_l 湿地类 l湿地资源 模 集l模 集 湿地破坏ll湿地保护 因素模型集ll措施模型集 输入—— —一对象———-输出 图2湿地保护 图l 濉地输入/输出需求驱动模霉5f 相关知识集 (1)湿地类型模型集。它是对湿地横向方面的分类,应选 择比重较大的湿地分类标准(湿地公约)建立标准湿地分类模 型。本文根据湿地公约与国内现有湿地分类标准,结合对扎龙 湿地的实际调查研究,总结得到扎龙湿地类型模型。该模型中 包含41个子类如水塘、盐田、湖泊、滩涂、盐沼等。 (2)湿地资源模型集。湿地类型模型是对湿地横向方面 的分类;湿地资源模型是对现有的湿地资源进行纵向方面标准 化的归类,包括土地资源、水资源、生态资源、泥炭资源、旅游资 源等五大类,植物、动物等21个小类。 (3)湿地破坏因素模型集。对现有的知识集的所有破坏 因素先进行归类,在把湿地破坏因素分为人为因素和自然因素 的情况下,再利用模糊集的方法对各个破坏因素进行划分,以 此确定对湿地资源对象的影响程度。 (4)湿地保护措施模型集。按照T程技术和管理两方面 分解出保护措施,建立的方法与湿地破坏因素相似。 (5)湿地生态特征变化模型集。按照资源(对象)进行分 类,并根据湿地破坏因素和湿地相应的保护措施分化出两种结 果,即正面变化的和负面变化的。评价湿地生态变化是正面变 化的还是负面变化的标准为:是否有利予湿地的可持续发展; 是否有利于湿地的健康发展;是否有利于湿地功能的正常运作 与发挥。 1.2湿地保护领域本体的建立 为建立完整的湿地保护领域本体,还需要进一步明确地 采用形式化的方法描述湿地领域中概念及概念之间的关系。 本文采用F列步骤逐步完成: (I)定义知识集中概念及概念 的层次结构。在实际应 用中,可采用自上而F与白下向上相结合的方式来进行模型中 概念的定义。例如鸟类和哺乳类就是动物这个概念的下层概 念。 (2)定义知识集中概念的属性。提供相关的属性来详细 描述概念的方方面面,如鸟类有颜色、大小、有翅膀、能飞行等 一系列属性。 (3)确定知识集中概念之问的关系,从而获得一个概念的 荚系集合尺。概念之闸的关系通常体现为继承、聚集、隶属及 集中词汇之间的语义关系。常用的语义关系有:A Member-of 关系——表示成员关系;Composed—of关系——表示构成关 系;Have关系——表示属性或事物的占有关系;Before,After, At联系——表示事物间的先后关系;Located.on(一at。一under. 一outside)——表示事物间的位置关系;Similar.to,Near.to联 系——表示事物间的相似和接近关系,如“鸟类夏季栖息在 扎龙湿地的某一类植物丛中”就含有在时间上和空间上的关 系。 (7)确定对象模型中概念的约束规则。即确定湿地领域 中概念发生的必要条件;时间性的约束;相互包含约束(一个 概念所代表的事件或关系A的发生与另一术语所代表的事件 或关系B的同时发生);相互排斥约束。 (8)定义实例。定义概念对应的实体,例如鸟类中的丹顶 鹤、白鹤。 (9)对领域本体编码、形式化。选用合适的本体描述语言 对上述建立的领域本体进行编码、形式化。在湿地保护领域本 体模型中,本文采用Prot ̄g6 2000_1 和OntoEdit软件。。 (0n toEdit在概念问的关系可视化功能上较好,而在本体的层次性 结构上不如Prot6g6 2000)相结合编码。生成的本体采用通用 的形式化语言RDF,RDFS以文件格式存储或存放在关系型数 据库Oracle中。经上述过程建立的湿地领域本体如图3所示。 窗体的左边部分为部分湿地领域本体的概念及其层次效果,右 边部分为本体概念之间的关系及其可视化效果。 ・■■,^●It固量 ¨-■■矗量 t_^为圈量 ¨●A冀生产蕾琦 ・‘一目开■期盛量 ・■木■一曲不鲁■盥胄 // /.I●■JI产品的不可一■开置 口过矗置t / / ¨‘挣 ・-口D博牲垃崖直童抒开●t■●鼍特 用 4《 ~ l i D生精辑枣辑 i 、、一・■工盘t’● 4 O石怕化工 ; OD丰镩由 |O寰盘■■工业泞■ '赡 jII 一 \ I D,阻 I OD■■上■|垃lc属怿it J : l湿地保护领域本体部分示意罔l l湿地中概念及概念荧系nf视化J 图3湿地保护领域本体构造 2本体在湿地领域中的应用研究 利用湿地领域本体,不仅可以构建湿地信息服务系统,或 者便于信息系统之间的集成及通信的实现,还可以对湿地保护 领域进行专项的研究,作为样本库及语料库,以此预测干扰因 素对湿地资源对象的影响结果。本文利用扎龙湿地领域本体 库进行了两方面的实际应用。 维普资讯 http://www.cqvip.com
・194・ 计算机应用研究 20O6年 2.1 基于Bfs的三层湿地服务系统 因与要采取的保护措施,将保护措施和破坏原因作为该神经网 络的输入就可以采用训练好的神经网络模型预测出在采取保 护措施后,对湿地的正面影响情况。 既然本体为语义Web提供了相关领域的共同理解,那么 在构建湿地信息服务系统时,采用湿地领域本体作为数据服 务层,就使得人类相互之间以及人类与机器之间能准确地进行 交互,从而实现湿地信息的共享与重用。本文基于此构建了 B/S(浏览器/服务器)结构的三层体系湿地服务系统,主要完 3 结论 本文通过对湿地保护存在的问题进行需求分析,建立保护 成扎龙湿地现状浏览分析、受影响原因及采取的保护措施的检 索等功能,系统体系框架图如图4所示。在该体系结构中,数 据服务层为本体数据库,有两种类型的数据:RDF(S)文件格 对象的输A/输出驱动模型。基于这个模型建立起湿地领域本 体,显式化、形式化地描述了湿地保护领域中概念的结构、层次 以及概念之间的关系,为湿地信息服务系统和基于神经网络的 式的本体数据和Oracle 8i中存放的扎龙湿地本体数据。中间 湿地专项研究提供数据及样本支持。由于目前大部分的湿地 服务层(Servlet、jena、推理机)承担了诸如业务规则、数据访 问、事件推理等工作。Servlet负责对Oracle数据库的访问及业 务规则;Jena插件主要负责对本体RDF文件的访问;推理机主 要负责根据现状分析出需要采取的保护措施等。浏览器端是 JSP动态服务界面,用于接收使用者的输入。在湿地信息服务 系统中采用本体作为数据库,在本体上进行形式化查询推理, 可以有效地方便用户查询,及时反映数据库的动态变化,提高 了查询效率。 中间服务层 数据服务 :本体库) 浏览器端 JSP/HTML 唾 = 据库J F 图4基于B,s的三层湿地本体服务系统框架 2.2神经网络的样本数据支持 所建的湿地领域本体中含有干扰因素与生态特征变化之 间的多对多关系,而这种多对多的关系为湿地领域基于神经网 络的湿地专项研究提供了相关的样本库。这时可以把神经网 络模型的输A/输出看作:领域本体中的湿地破坏因素集、湿地 保护措施集一湿地类型集、湿地资源集一湿地生态特征变化 (如表1中的输入和输出示例),进而可以对应于预测规则的 前提和结论,即把神经网络的输入/输出节点分别对应于规则 的每条前提和结论,而用输 输出的取值来反映湿地领域本 体中概念属性隶属其真值的程度。 表1输A/输出示例 输人 输出 围垦湿地变农用地 洪涝灾害 扎龙沼泽湿地面积的减少 湿地作为废物处理区 丹顶鹤数量的减少 城市的扩展外延 扎龙湿地生态种类的减少 工业开发 路基建设 例如下面的规则:IF(C /F。,C /F2,…,C /F )一THEN (R。/cfI,R /cf2,…,R /cfm),其中C.,C ,…,C 为条件要素; R.,R ,…,R 为结论要素;F.,F2,…,F 和efl,c ,…,cfm分 别为各条件的可信程度与各条结论成立的可信程度。假设这 些要素之间以AND连接,则可以与这样一个神经元网络模型 对应:该模型输入层有 个神经元,输出层有m个神经元,网 络输入层节点的输入值分别为本体中的湿地干扰因素的可信 度,而网络输出层各节点的输出值分别为对湿地特征变化的确 信程度。针对扎龙湿地生态特征变化的现状,分析出其破坏原 领域本体是由人工开发的,因此将耗费大量的人力、物力和财 力,时间周期也很长,这在一定程度上影响了湿地本体的应用。 下一步的研究重点将围绕着本体创建的自动化与半自动化展 开。 参考文献: [1]Gruber T.Towards Principles for the Design Ontologies Used for Knowledge Shairng[J].International Journal of Human‘computer Studies.1995.43(5/6):907-928. [2]杨秋芬,陈跃新.Ontdo ̄方法学综述[J].计算机应用研究, 2002,19(4):52-71 [3]何海芸,袁春风.基于Ontology的领域知识构建技术综述[J].计 算机应用研究。2005,22(3):14-18. [4]袁梅宇,本体在信息变换中的建模方法[J].计算机应用研究, 2004,21(2):153-156. [5]汪方胜,侯立文,蒋醢.领域本体建立的方法研究[J].情报科学, 2005,23(2):241-244. [6]Lopez M F,Gomez-Perez A.Sierra J P,et al,Building a ChemicM Ontology Using Methontology and the Ontology Design Environment [J].Intelligent Systems and Their Applications,1999,14(1):37‘ 46. [7]Chen G.Lu R Q,Jin Z.Constructing Virtual Domain Ontologics Based on Domain Knowledge Reuse[J].Journal of Sotfware.2003, 14(3):350—355. [8]吴志勇,黄)ll友.湿地构成变化与湿地保护[J].环境科学与技术, 2001,24(z2):32-34. [9]盖赫莉,王淑梅,王欣.对扎龙湿地生态环境的分析[J].黑龙江环 境通报.2002,26(3):94-96. [10]李渡,苏岐芳.用晏敏,等.扎龙湿地的生态环境评价厦防治对策 【J] 中国环境监测,2002,l8(3):33-37. [11]张大鹏,孙化江.扎龙自然保护区面临的主要生态环境问题厦其 改善对策建议[J].地质灾害与环境保护,2005。16(1):58—62. [12]Stanford Medical Inforrnatics.Protege—User Guide[EB/OL],http:// protege.stanford.edu/publications/UserGuide.pdf。2004. [13]Sure Y,Erdmann M,Angele J,et a1.OntoEdit:Collaborative Ontolo— gy Development for the Semantic Web[C].Sardinia:Proc.ofthe 1st ISWC,2002.1—18. 作者简介: 邢军(1972-),男,博士研究生,主要研究方向为Web数据挖掘、本体构 造、语叉Web;周开朋(1981一),男,硕士研究生,主要研究方向为本俸 创建厦应用、语义网;韩敏(1959一),女。教授。博导,工学博士,主要研 究方向为神经网络、3s系统及混沌序列分析等
因篇幅问题不能全部显示,请点此查看更多更全内容