本体从哲学领域被引入到领域以来,国内外对其作了大量的研究,各种本体相关的应用研究也开展的如火如茶,主要集中在计算机科学、医学、农学和图书情报学等领域李景,。课程本体是领域本体的一种,属于专业性的本体,描述一门课程中的概念以及概念之间的关系或者该课程的重要理论和基本原理。课程本体知识库一方面可以改变学生从前对知识点的孤立记忆、增强理解、使学生更好的学习,另一方面可以给教师提供该课程领域内共同认可的规范的概念及其关系,有利于教学内容的统一,也为辅助教学的各种智能教学系统的开发提供符合教学需求的技术基础。课程知识本体可以被定义为“课程中一套得到认同的、关于概念体系明确、正式的规范说明”。课程知识本体主要由课程中的概念、概念间的关系以及计算机可以识别的形式化描述语言组成。构建课程知识本体的目标是要形成对于该课程知识组织结构的共同理解与认识刘光蓉,。国外对本体的研究开展的比较早,目前主要有。是由美国普林斯顿大学五认知科学实验室理的教授负责开发研制的,是迄今为止计算语义学、文本分析等相关领域研究者可获取的最为重要的资源。国内,中国人民大学信息学院提出了一套指导一系统中课程知识本体构建的模型,以课程知识点为基础建立本体概念模型,按照教学步骤和教学规律将课程知识点中的核心概念提取出来,建立概念之间的关系,采用标准的本体语言对概念进行定义和描述,形成课程知识本体模型崔旭,。北京大学现代教育技术中心崔光佐等人设计了一种新型的教学支持平台,称为。这个平台以教学本体为核心,具有可扩充、自组装和可定制等性能,还可随着用户的使用不断深化其知识库,从而进一步扩充教学支撑平台。该平台对教学本体中的概念以及概念之间的关系描述得比较全面、精确。但是由于基本素材数量巨大,课程本体的扩充和规范需要进一步研究崔光佐,。台湾研究院中英双语知识本体三类领域知识本体,即唐诗三百首知识本体、苏轼诗知识本体、鱼类知识本体,虽然构建了本体但未用于实际应用当中。一些硕士论文也对基于本体的课程本体知识库进行了研究,比如《数据结构》、《程序设计》、《计算机网络》、《离散数学》、《经济学》、《英汉翻译》等等多门课程都有了初步的研究,为更多课程本体知识库的构建提供了很好的借鉴。软件工程领域的本体知识库,目前国外正在研究的过程中,有很著名的网站,方便软件工程相关领域的本体知识库的研究和构建,而国内只有北京航空航天大学对软件测试的部分内容做过相应的理论研究,针对软件工程课程领域的本体知识库暂时还属于空白。国内外题库系统研究现状题库是“按照一定的教育测量理论,在计算机系统中实现的某个学科题目的集合”,是严格遵循教育测量理论,在精确的数学模型基础上建立起来的教育测量工具。目前国内外有许多的网上考试都广泛采用了题库系统,例如,美国组织的“计算机文化考试”、“高级就业计算机科学考试”、“专业领域考试”、“”、“”英国计算机学会和分别组织了计算机考试,并普及到英联邦国家日本于年开始设立“信息技术人员考试”,成为仅次于高考的第二大考试国内的网上考试有人事部和信息产业部组织的“中国计算机软件专业技术资格和水平考试”,教育部组织的“全国计算机等级考试”,全国电大网上考试,教育部从剑桥引进的“剑桥信息技术证书考试”,以及认证考试、微软认证考试、认证考试、认证考试等等秦哲,。题库系统的研制一直是一个非常活跃的课题,产生了巨大的经济与社会效益。特别是随着教考分离等教学改革的开展,对各门学科建立题库系统,显得尤为重要,也是精品课程建设的重要内容。一套具有较强实用性、功能性、方便易用的题库管理系统,可以切实减少教师在考评方面的工作量、提高工作效率,是学校教育教学改革的重要部分,具有很好的现实意义。但是现有的题库在出题的准确性、合理性和全面性方面普遍存在一些问题,试题很难兼顾知识点的前后关联性和覆盖面,使题目相似程度较高、知识点涵盖不全。本文介绍的网上试题库系统,采用无限级考纲树结构来管理考纲知识点,可以随学科内容的变化适时更新使用试题拆分方案存储试题,使试题的检索更加方便,物理存储更加高效并支持图片、声音、图像等多种格式多媒体试题。在开发过程中,采用目前流行的体系结构,部署上方便、移植灵活、易于维护和具有可伸缩性可以使试题库系统更具开放性和扩展性。目前,软件工程相关的题库系统的建设有待规范和提高,大多都是上传几套已经手工组成的试卷,形式和内容都比较单一,无法满足学生练习和老师出卷的多种形式的要求。题库系统建设的滞后成为了软件工程精品课程建设的薄弱环节,严重影响了精品课程建设的质量。
1.2 课程本体的发展趋势
本体是一种用来描述概念以及概念之间关系的模型,可以用简单的表达方式刻画复杂的课程知识。基于本体的课程知识库可以用术语或概念对课程知识进行表示,同时揭示这些知识之间的内在关系,从根本上解决教育资源共享和重用等问题。一门课程的本体知识库不仅有利于教学资源的统一,还为各种智能教学系统提供了底层知识库,给老师的教学和学生的学习带来了便利。除此之外,课程本体的进一步研究也为语义网的建设和发展提供了必要的资源。可以预见,本体技术应用于课程知识组织和学习资源建设是一个必然的趋势。本课题研究如何将本体技术引入课程知识库建模过程,构建一个基于本体的软件工程课程知识库,同时,开发一个基于软件工程本体知识库的题库系统,验证基于本体的软件工程课程知识库在个性化学习及智能教学系统中的应用。本研究目的和意义有如下几个方面。第一,构建软件工程课程的本体知识库可以更好的促进教学。建立软件工程课程本体知识库,可以捕获软件工程课程共同认可的术语和概念,提供人和机器对课程知识点的共同理解,并给出这些概念之间相互关系的明确定义,表示出共同认可的、可共享的知识,形成一个基于本体知识库的体系结构,对知识点及其知识点之间的相互关系进行科学的描述和组织。有了这些共同认可的概念及其之间的关系,一方面可以改变学生从前对知识点的孤立记忆、增强理解、使学生更好的学习,另一方面可以给教师提供该课程领域内共同认可的规范的概念及其关系,有利于教学内容的统一,也为辅助教学的各种智能教学系统的开发提供符合教学需求的底层知识库。第二,题库系统的建设是改进教学手段的重要方面。大学教育提倡以学生自学为主,因此题库是一种重要的学习资源,属于学生学习环境的一部分,因此题库系统的建设就成为了现代课程建设中的一项重要工作。一套具有较强实用性、功能性、方便易用的题库管理系统,可以切实减少教师在考评方面的工作量、提高工作效率,是学校教育教学改革的重要部分,具有很好的现实意义。但是现有的题库在出题的准确性、合理性和全面性方面普遍存在一些问题,试题很难兼顾知识点的前后关联性和覆盖面,使题目相似程度较高、知识点涵盖不全。本体作为一种能从语义和知识层次上描述信息系统的概念模型建模工具,引入到题库系统的建设中,利用自身在知识描述方面的优势,弥补传统题库在知识点覆盖范围和知识关系模糊的缺点,使其更能体现人脑知识的结构,更好的模拟了人脑出题的流程,在试题检验系统的辅助下,使最后组成的试卷更符合规范。第三,本体的发展有利于未来语义网的构建发展。语义网是能够根据语义进行判断的网络,但实现起来却是一项复杂而浩大的工程,而本体则是语义网发展的基础。构建软件工程课程的本体知识库可以为未来语义网的建设提供资源。基于本体的软件工程课程知识库建设暂时属于空白,而将本体技术引入题库系统的建设也是一种新的尝试。首先,本课题的研究对于软件工程课程的学习有很大的促进作用,为软件工程的资源共享和个性化智能学习提供资源,有很强的现实意义。其次,本课题的研究可以给其它课程提供很好的示范作用。另外,也为软件工程整个领域的本体构建提供参考依据,为未来语义网的建设提供资源。
2 本体论的相关知识
2.1 本体概述
本体的概念最初起源于哲学领域,可以追溯到公元前古希腊哲学家亚里士多德,是研究存在的本质的哲学问题。最近几十年,这个词被应用到计算机领域,并在人工智能、计算机语言以及数据库理论中扮演着越来越重要的作用。在讲述软件工程课程本体的研建之前,先来了解一下本体论的相关知识,这将有助于更好地理解软件工程课程本体知识库的研建。本体理念的渊源可以追溯到对世界的本质进行描述的哲学领域。世纪年代,为计算机领域所用。但是到目前为止,对于本体论,还没有统一的定义和固定的应用领域。本体这个哲学范畴,后来被人工智能界赋予了新的定义,从而被引入信息科学中。年,等人最早给出本体在信息科学中的定义“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延规则的定义”。后来在信息系统、知识系统等领域,随着越来越多的人研究本体,产生了不同的定义。年,给出了本体一个最为流行的定义“概念模型的明确的规范说明”。年,进一步完善为“共享概念模型的形式化规范说明”。当前,在人工智能领域普遍认同德国卡尔斯鲁厄大学的等人在年对上述几个定义进行了深入的研究后提出的概念是共享概念模型的明确的形式化规范说明。定义包含了四层含义本体是概念化的,它是一个概念体系,又称概念模型。所谓概念化是指“客观世界中某些现象的一个抽象模式,该模式是通过定义了这些现象的相关概念形成的”。本体是明确的。是指“被引用的概念所属的上位类与在使用此概念时的限制条件应预先得到明确的定义和说明”。本体是形式化的。是指“本体应该具有机器可读性”。本体是共享的盯。是指在一个本体中,知识所表达的观念、观点应该“抓住知识的共性,也就是说,它不只是为某一小部分人所接受的,而是为整个群体所接受的”李景,。尽管定义有很多不同的方式,但是从内涵上来看,不同研究者对于本体的认识是统一的,都把它当作是领域领域的范围可以是特定应用中,也可以是更广的范围内部不同主体人、机器、软件系统等之间进行交流对话、互操作、共享等的一种语义基础,即由本体提供一种共识。而且本体提供的这种共识更主要的是为机器服务,机器并不能像人类一样理解自然语言中表达的语义,目前的计算机也只能把文本看成字符串进行处理。因此,在计算机领域讨论本体,就要讨论如何表达共识,也就是概念的形式化问题。在实现上,一个本体往往就是一个正式的词汇表,其核心作用就在于定义某一领域或领域内专业词汇以及他们之间的关系。这一系列的基本概念如同一座大厦的基石,为交流各方提供了一个统一的认识。在这一系列概念的支持下,知识的搜索、积累和共享的效率将大大提高,使真正意义上的知识重用和共享也成为可能。从知识表示角度考虑,本体和知识库有类似之处,都是对一个具体或是抽象领域中包含的知识的定义、表示和组织。其主要区别是知识库包含了特定领域抽象或特定的知识,而本体是概念层次上对概念化的清楚描述,更注重概念层次上术语及术语间关系的表述。从功能上来讲,本体和数据库有些相似,但是本体比数据库表达的知识丰富得多。首先,定义本体的语言,在和语义上都比数据库表示的信息丰富得多更重要的是本体提供一个领域严谨丰富的理论,而不单单是一个存放数据的结构。本体
是领域内重要实体、属性、过程及其相互关系形式化描述的基础。这种形式化的描述可成为软件系统中可重用和共享的组件。
2.2 本体的描述语言
本体描述语言起源于历史上人工智能领域对知识表示的研究,是用来描述本体的,为用户提供领域模型清晰、形式化的概念描述。因此本体的描述语言应该满足以下要求:良好定义的语法,良好定义的语义,充分的表达能力,有效的推理支持,表达的方便性,RDF资源描述框架是组织在的基础上推荐的一种标准,用来描述资源及其关系的语言规范,具有简单、开放、易扩展、易交换和易综合等特点。采用“资源一属性一属性值”的“主谓宾”结构或称三元组,提供一种框架容器,并通过定义了一套形式化的方法,成为机器语义理解的结构基础。的目标是为资源描述提供一种通用框架,它以一种机器可理解的方式被表示出来,可以很方便的进行数据交换,提供了数据集成的元数据解决方案。由以上分析可以看出表达力明显不足,不能很好的满足的本体的需求和提供了比较强大的表达力,但推理复杂度比较高,适用于概念系统比较复杂的领域表达力虽然有所欠缺,但由于在上建造和使用本体的难度都比较小,比较适用于一般应用。这些语言都基于的语法,不仅适合应用,通过相应的解析程序,在别的领域也可以使用,本体的构建面向特定的领域,如果没有好的方法指导,就很难在不同领域本体的构建中保持一致,不利于本体的规范和规模建设。因此,本体构建方法的研究对于本体的构建至关重要。但是到目前为止,本体构建方法仍然没有一个统一的标准,构造本体的过程都各不相同。现有的本体建模方法主要有一法、骨架法、工程法和七步法。由于对各自领域和具体工程的不同考虑,本体构建的过程各不相同。为了更好的指导构建,人们研究分析了现有的本体构建方法,归纳出一些有用的本体构建准则。一般都将在年提出的点原则作为构建本体的原则明确性和客观性本体应该用自然语言对术语给出明确、客观的语义定义。一致性知识推理产生的结论与术语本身的含义不会产生矛盾。完整性所给出的定义是完整的,能表达特定术语的含义。可扩展性向本体中添加通用或专用的术语时,通常不需要修改已有的内容。最少约束对待建模对象应该尽可能少列出限定约束条件。另外,还有一条专家们都公认的规则在构建领域本体的过程中,需要领域专家的参与和协作。当然,包含飞教授提出的三条本体构建规则也值得我们借鉴和参考后建本体必须逐条参照先建的相关本体,并沿用其所有合理的条目若弃用先建相关本体的条目,必须阐明实质性分歧此原则也适用于任何本体的自身修改过程。