河北水利
主办单位:河北省水利厅
国际刊号:1004-7700
国内刊号:13-1131/TV
学术数据库优秀期刊 《中文科技期刊数据库》来源期刊
       首 页   |   期刊介绍   |   新闻公告   |   征稿要求   |   期刊订阅   |   留言板   |   联系我们   
  本站业务
  在线期刊
      最新录用
      期刊简明目录
      本刊论文精选
      过刊浏览
      论文下载排行
      论文点击排行
      
 

访问统计

访问总数:39566 人次
 
    本刊论文
面向知识服务的水利工程知识组织模型构建

  摘要:在当前水利现代化建设新形势下,对水利工程知识要求急剧性增长,而目前水利工程知识呈现混乱、无序状态、难以利用等现状,在充分理解和分析水利工程知识供需矛盾问题的基础上,从知识服务角度对水利工程知识进行宏观架构,以水利工程问题的求解为切入点,以解答用户水利工程问题为目标,形成包括水利工程问题分解和用户需求分析、水利工程知识组织的架构、规范设计、知识组织和检索系统设计的水利工程知识组织体系,借助基于粒度原理建立水利工程知识组织模型,动态序化和共享水利工程知识,快捷高效地解决用户提出的水利工程问题,为我国水利现代化建设提供智力支撑。

  关键词:知识服务;水利工程;知识组织;粒度原理

  新中国成立以来,党和国家各级政府十分重视我国水利建设,已积累了大量宝贵的经验也汲取了一些失误教训,这些经验教训是我们继续从事水利工程建设和管理的宝贵财富,我们必须将这些财富(知识资源)得到高效利用。但目前在水利信息资源的利用上还存在各自为政、低效应用状况,水利工程知识呈现混乱、无序状态;由于现代科学技术飞速发展和人类需求不断增加,水利工程知识组织的难度越来越大,解决水利工程问题涉及不同门类、层次、形式的知识越来越多,知识处理过程越来越复杂,难以获取和利用已有知识有效解决用户提出的水利工程问题。所以目前水利工程知识的组织难以满足当今现代化水利建设的要求,更谈不上提供全面、快速、准确的水利工程知识服务。因此非常有必要研究水利工程知识组织,以便实现水利工程知识服务,而实现对水利工程知识服务的最基础的研究就是实现水利工程知识的组织和检索。

  本文正是基于这一背景,紧扣新形势下对水利工程的要求,基于水利工程问题的理解和分析基础上,从知识服务角度研究水利工程知识的组织,解决面向符号的水利工程知识获取方法与人的思维方式之间失配问题,建立水利工程知识组织模型,动态序化和共享水利工程知识,快捷高效地解决用户提出的水利工程问题。

  1、国内外文献述评

  国内对水利工程知识组织的研究还处于起步阶段,主要集中在高等院校、科研院所以及各级水利管理机构。2013年5月3日通过CNKI检索主题为“知识组织”的文献共有2811篇,检索主题为“水利工程”的文献共有52278篇,检索主题为“水利文献”的文献只有45篇,检索主题同时包括“水利工程”和“信息服务”的文献只有24篇,未检索到主题同时包括“水利工程”和“知识组织”的文献,说明已经形成水利工程建设和管理等相关知识,对水利文献研究成果不多,但从信息服务角度研究水利工程成果较少,从知识组织角度研究水利工程知识的文献更少。由此可见,知识组织方面的成果主要集中在图书情报领域通识知识的组织,水利工程方面的成果主要集中在技术和管理角度对水利工程知识探讨。

  1.1国内外知识组织研究的现状“知识组织”始见于1929年美国图书馆学家布利斯的专著,并在图书馆学、情报学的分类系统和叙词表研究基础上发展起来的,是信息组织的最高形式,其核心是知识序化,知识组织是揭示知识单元(包括显性知识因子和隐性知识因子),挖掘知识关联的过程或行为,目的是最为快捷地为用户提供需要的知识或信息。AlonFriedman首次提出了结合知识表示、语言学模型和概念理论的知识组织方法。GailHodge在知识组织语义化工具层面上将知识组织界定为3个层次、11种类型。

  DAHLBERG在ISKO20年纪念大会上提出了知识组织迫切需要解决的10个问题。他认为在知识表示的理论和应用中,需注意概念(知识单元),概念层(词,术语,编码)以及词句层的识别基础的区别。Park等提出以一个以内容为中心、以分面分类法作为设计本体结构的方法,并通过酒本体的实例展示图书馆和信息科学中的知识组织方法。ThomasBakerSB从语义网角度研究SKOS,提取影响SKOS设计的关键因素。Donald等利用GoogleKnol工具,体现同级评审过程中透明性和包容性,通过产生、修改完善、评估和适应以及发布四个阶段进行开放创新知识设计。

  目前国内知识组织研究主要集中在知识组织概念、基础理论、关键技术和方法等方面,而且主要集中在图书情报学科,主要代表成果有马费成教授指出,用文献为基本单元来评价、表示和组织知识所得到的仅仅是知识组织和利用的“物理解”,而非“情报解”,结合网络信息资源集成所面临的困难提出一个基于关联数据的网络信息资源集成框架。1991年,刘洪波发表以“知识组织论”为题名的论文指出“图书馆内部活动的本质是知识组织,图书馆知识组织是对人类知识体系结构的模拟和对大脑知识记忆结构的近似模拟”,已经在知识组织中考虑知识服务对象即个体因素。1998年,王知津指出知识组织顺应了信息社会和知识社会的发展,梳理知识组织的定义,并对知识组织的目标及其活动领域进行了深入探讨。张文亮、徐跃权从微观、中观和宏观三个层次全面系统地理解和解释知识组织的概念和理论体系,通过知识发现、知识描述最终实现知识的表达、共享与创新。贺德方从知识组织体系的构建和应用角度,对知识组织体系之间的转化、映射以及标准化等方面研究成果进行梳理和总结,认为用户参与和用户使用优先是知识组织的趋势。毕强分析知识组织系统的相关研究成果并揭示知识组织系统构建从机器可读到机器可理解的发展趋势。王曰芬等研究了面向个性化服务的知识组织机制,将用户需求和用户隐性知识纳入其中,形成了个性化服务的知识组织的过程和方法。以侯汉清为首的南京农业大学研究团队对知识组织系统、受控词表互操作、叙词表等进行了全方位、多角度的研究。宋培彦研究网络环境下知识组织的特征,提出了基于“分类-主题-用户标签”多级映射的结构化概念空间模型,对网络知识百科组织提出知识组织参考。夏立新等从行为学角度研究政务门户知识组织,对不同类型的信息用户提供相应类型的个性化服务,形成面向用户特征信息服务和知识门户相结合的政务门户系统。

  1.2水利工程知识组织和应用现状目前水利工程知识主要以文献资料和业务系统两种形式存在。其中文献资料以水利文献信息系统为主,主要包括中国水利百科全书、水利专利、水利相关标准、水利科技报告、水利古籍数据库、水利博览数据库、防洪减灾数据库、国外水利数据库、会议论文、学位论文以及期刊数据库等;业务系统形式水利工程知识主要存在防汛抗旱等水利建设和管理业务系统中的数据资源。虽可以通过主题、题名、作者、内容等方式对水利工程文献进行检索,但是检索结果迅速膨胀,难以从中获取有效解决问题的知识。梁宁分析水利文献信息资源共建共享存在资源“建”与“享”的不平衡、缺乏行业统一协调等主要问题,并提出相应的解决对策,但主要从信息技术角度探讨水利文献信息系统的建设和管理。李晶等通过对水利文献信息资源进行联合编目和加工,形成在网上实现远程查询、异地阅览的水利专业数字图书馆;信息资源服务主要通过水利工程业务系统提供信息服务,2008年亚太地区水利知识中心在黄河水利委员会成立亚太地区水利知识中心水利信息化与流域管理知识中心主要各种形式的信息资源服务。高新陵等明确信息服务模式要求建立多样化的生态信息服务和解决问题的事实数据挖掘,提出基于问题的水利文献信息系统服务模式,虽提出基于问题的服务模式,但主要侧重在对解决问题的事实数据挖掘,没有高效解决用户问题角度分析水利工程知识。张长征、黄德春、UpmanuLall等对水资源调度过程进行分析,结合知识情境和知识管理的关系,构建了南水北调东线一期工程调度的知识管理框架。虽在防汛调度决策、混凝土坝施工仿真专家系统等方面比较注重知识的组织,但应用领域有限,因此目前水利工程知识的组织方式仍为传统的存储和检索方式,水利工程知识匮乏,已远不能满足国内水利工程建设和管理机构的实际需求。

  1.3基于粒度的知识组织研究现状赵昌葆以工程知识为背景,以工程问题求解为目的,建立基于粒度知识的综合求解方法,提出概念模型、应用模型与解释模型三层次的集成工程知识管理模型,并在工艺设计方面进行实践应用,但知识管理模型主要侧重显性工程知识组织和推理,对于特定工程领域有待融入情景和专家经验知识,跨领域知识集成和运用,解决工程问题的求解有待进一步优化。杨人子、严洪森针对知识化制造系统自重构中知识网检索方法过于主观以及重复检索和运算等问题,提出基于信息粒度的知识网的模糊分类和检索方法,解决了自重构运算导致的知识网存在多样性的问题,考虑知识网在“质”、“量”和复杂性等方面的差异,按照用户需求,将知识网库中的知识网进行聚类,使得最终新知识网的复杂性降低,而且可以得到目标知识网满意度的排序,有效提高分类的正确率,消除聚类结果和先验知识之间的主客观不谐调性,但聚类模型中相似性测度函数的不同影响聚类结果的唯一性,对知识网间的完善度和匹配度的获得科学性有待进一步改善。

  王超羽采用了职能部门按流程、业务部门按专业部门进行知识梳理的处理方法,提出了设计院产品知识库、专家人才库和客户管理库所包含的基本内容和建立方式,通过分析明晰知识管理的主体因素的状态,预测了水利水电勘测设计院在实施知识管理过程中可能遇到的问题,并提出有效的解决措施。该研究重点从企业角度探讨水利工程知识的管理和积累,没有对探基于水利工程问题解答的知识管理,也没有对水利工程知识进行深度组织和加工。

  2、水利工程知识组织问题剖析

  通过文献分析可知,国内外已经对水利工程知识及其应用进行了大量研究,重视水利工程知识产生,对水利工程知识组织和应用没有引起重视,但通过知识处理系统解决的问题十分广泛,由此可见水利工程领域是一个重要而有前景的应用领域,最核心的问题是高效快速解决用户遇到的水利工程问题。但目前研究主要存在以下不足:

  a.水利工程知识呈现无序状态,用户难以获取和利用。目前已有的水利文献等水利工程知识主要分散各水利科研院所、高校、机关、各大信息机构等,存在很大程度的重复和同质,各自为政,缺乏行业系统性协调和组织,导致水利工程知识管理和共享。

  现有的水利工程知识表示方法,一方面,无法充分表达水利工程问题求解中需要的语义,包括构成原因和结果部分的不同因素类型,因素的不同量化程度,因素之间的不同关系;另一方面,各类水利工程知识的表示没有遵循统一的规范,呈现各自为政特点,缺乏面向知识服务的水利工程知识总体架构和组织,水利工程知识组织和应用方式单一,范围窄,所以对水利工程问题只能提供“物理解”,无法为用户提供水利工程问题“情报解”。

  b.知识组织方法的实践性探索研究,行业的针对性不强。国内知识组织研究集中在知识组织概念、基础理论、关键技术和方法,由于限于具体技术方法问题,还缺乏针对行业的理论结合实践的研究。国外的研究虽然也有很多成果探讨了信息的本体组织和知识地图等知识的组织技术,但均没有系统地去研究针对行业的知识组织架构和实现问题。知识组织方法的理论研究目的是指导知识组织的实践应用,而水利工程知识组织实践应用是水利工程知识组织的重点和难点。

  c.水利工程知识检索不准确、知识处理智能性和协同性差,难以提供满意的水利工程知识服务。由于目前基于关键词的信息技术难以找到所需要的信息,而水利工程知识不能表达足够的语义,无法包含各种对问题求解有用的信息,如问题描述对象的特征信息、关于解的启发式信息及各种约束关系信息,在问题求解推理中由于语义不足,结果的确定性和可靠性都降低了。虽有利用粒度原理解决工程知识问题,大多局限于显性知识的组织和推理,跨领域和跨系统的集成不足,缺乏融入专家经验知识和情境知识,导致推理的结果难以解决用户的问题。

  3、基于粒度原理的水利工程知识组织系统模型构建

  本文以解答用户水利工程问题为目标,针对水利工程行业现状和用户需求,对水利工程问题和知识进行粒度化,形成包括融入水利工程问题的用户需求分析、知识组织准备、水利工程知识组织的架构以及知识组织过程。

  3.1用户需求分析不同文化程度、不同知识背景、不同职业的用户对知识需求不一样,形成水利工程领域不同类型的问题,而要解答这些问题需要充分分析问题所在领域、背景、用户行为的基础上,以资源驱动的传统知识组织难以达到解决问题的目的,因此对知识组织提出融入问题的新要求,有必要对知识重新科学地组织。

  3.2知识组织准备水利工程知识组织准备是有效解答问题的基础和保障,知识组织准备主要包括:a.粒度化分类和聚类准备,针对不同问题的解答需要不同粒度大小的知识,运用模仿人思考方式得粒度原理动态分类和聚类知识,除了对知识粒度化概念进行界定外,制定相关规范来引导知识粒度化和知识组织,以支撑问题解答。b.数据准备,将知识组织构建准备作为知识组织前重要的基础工作,也就是说从知识组织的数据、粒度化、知识构建规范、知识组织工具等方面系统规划,为知识组织和知识服务奠定基础。

  3.3水利工程知识组织的总体架构知识组织目标是为用户提供有针对性的知识,即将水利工程领域的数据资源经过科学处理、整理、关联,最终形成能够解决用户问题的知识。在知识组织过程中循科学性、系统化、目的性、以用户为中心、学科性、易用性、多维性以及共享性等原则构建和整合各种资源,为了更加有效地组织知识,有必要明确知识组织构成,其构成要素主要包括知识服务提供方、知识资源、服务接收方、知识组织工具等四个要素。如图1所示水利工程知识组织总体架构,是水利工程知识组织的基础和蓝图,将水利工程知识分为数据资源层、知识组织层以及知识服务层,其中数据资源层主要提供原始数据和经过简单分类和组织的数据资源,知识组织层针对用户的问题,结合数据资源层提供的数据资源进行知识点、知识单元分类和关联,形成待解决问题与知识模块之间的映射集。知识服务层通过知识检索平台为用户提供问题解答服务,同时采集用户使用知识的日志。

  3.4基于知识粒度的水利工程知识组织系统的设计基于粒度原理的水利工程知识组织系统设计主要包括水利工程知识获取和粒度分类、问题驱动的知识粒度动态组织两方面内容,是水利工程知识组织的核心。

  3.4.1水利工程知识获取和粒度分类主要对水利工程知识进行抽取、分类和聚类,是知识组织系统的输入部分,通过获取文献数据库中2000-2012年间以“水利工程”为主题的42727篇文献,形成用户对水利工程知识的初步需求;同时对42727篇文献进行相关知识点抽取,为了更好地促进问题的解答,特别针对知识以及知识之间不确定性的描述,从不同层次和角度描述知识的属性,按照一定规则和领域专家经验对水利工程知识进行粒度聚类和分类,通过知识粒度来表示知识的分类能力,体现知识的不同粒度大小和不同层次,为了深度组织和利用水利工程知识,通过粒度大小和相似度来描述粒度知识。

  定义1(粒度大小的定义):设K是论域,A为属性集,知识p在论域K上导出不同类的划分为{X1,X2,…,Xi,…},则知识Xi的粒度大小定义为:g(Xi)=|Xi|/|K|,其中|Xi|表示第i类型知识包含样本个数,|K|表示K中的总样本个数。增加上下近似集Xi看作是一个具有单个成员的类,这些类型划分包括等价关系、不可区分关系、功能相近关系、相似关系、相等关系、约束、相容关系、复合关系、模糊关系、属性、投影、结构关系和一般的函数等。通过粒度大小的度量对获取的水利工程知识进行初步分类,初步体现每类知识的粒度大小。

  定义2(相似度的定义):设K=(X,A)为聚类空间,X为论域,A为属性集合,在粒度知识定义的基础上,通过Sim(xi,xj)来表示样本xi,xj间相似性,样本间相似度S(xi,xj)定义:Sim(xi,xj)=1/(1+Wl(ΣAl=1(xil-xjl)2)1/2)其中Wl=Σni=1Xi2K2,表示样本在l属性下分辨能力,通过Wl平衡样本属性值过大或者过小对样本间相似度度量的影响。

  在粒度大小和相似度定义基础上,按照以下步骤进行知识分类和聚类。(ⅰ)对水利工程知识用一个聚类表示K={k1,k2,…,kn},分别计算每类水利工程知识之间相似度Sim(ki,kj);(ⅱ)选择具有最大相似度的类对max(Sim(ki,kj)),并将ki和kj合并为一个新的类kl=ki∪kj,并形成一个新的聚类K(k1,…,kn-1);(ⅲ)逐步形成粒度较大的水利工程知识,同时计算粒度较大知识之间相似度,通过知识粒度和相似度描述水利工程知识颗粒大小和相互之间初步关联,为后期知识再组织创造条件,是知识组织系统设计的初级阶段和基础。

  3.4.2问题驱动的水利工程知识粒度动态组织主要解决两个方面的问题:一是如果水利工程知识粒度过细,需要合并知识形成较粗粒度知识;二是如果水利工程知识粒度太粗,难以直接解决用户问题,需要将知识分解为较细粒度的知识。通过对知识粒度动态调整,得到有助于问题解答的粒度知识。针对用户问题,从问题论域、结构和属性三个角度分别进行问题颗粒化,并对问题解答所需知识进行粒度调整,在粒度知识初步分类基础上,根据粒度问题与静态水利工程粒度知识相关度比对后形成各问题所需的粒度知识,通过对不同层次和不同粒度知识合并、分解以及关联,根据问题需要对知识粒度加粗或者细化等操作,形成动态水利工程粒度知识网,并尝试解决用户问题,如果未有效解答用户问题,需要对粒度知识再次分类和管理等操作,直到有效解决用户问题,并形成用户问题最终有效的解答,为用户直接提供问题的解,构建水利工程知识粗细粒度双向动态关联水利工程知识网。

  以上构建的水利工程知识动态组织模型可以应用到水利工程领域的各个方面,例如在水利信息化领域,通过已有文献、数据等资料形成数据资源层,借助水利信息化理论和实践案例进行关联和分析,提取多个水利信息化知识单元和问题知识单元,并组成水利信息化知识组织网。解决水利信息化工程中无法采集水位的问题,首先对无法采集水位的问题进行粒度化,分解为不同粒度的问题,并分析各类问题可能涉及的水利信息化知识组织网,例如水位采集器的故障可能是前端采集器故障,也有可能是后台软件故障,通过问题分层求解方式遍及各种可能导致故障的原因,并结合水利工程粒度知识网进行推理和分析,直到分析出水位采集器的故障,最终解决无法采集水位的问题。

  4、结束语

  本文针对目前水利工程知识组织现状、存在主要问题,从知识服务视角探讨水利工程知识组织,并总体架构水利工程知识组织模型,重点以解决用户问题为目的,对水利工程知识进行静态组织和动态再组织两个阶段组织,以实现高效水利工程知识服务,本文提出针对水利行业知识组织模型,并通过无法采集水利的问题说明知识组织模型的应用,为水利工程知识整理、关联、传播、共享提供指导,下一步重点探讨水利工程知识组织实践应用,不断完善已经构建的水利工程知识组织模型。

特别说明:本站仅协助已授权的杂志社进行在线杂志订阅,非《河北水利》杂志官网,直投的朋友请联系杂志社。
版权所有 © 2009-2024《河北水利》编辑部  (权威发表网)   苏ICP备20026650号-8