随着Internet和Web技术的发展,远程教育已经成为网络研究和应用的热点之一。基于Web的远程教育是继函授教育和广播电视教育之后于20世纪90年代出现的一种新的教育模式。
现代信息技术的快速发展,使利用卫星传输技术、计算机网络技术和多媒体技术进行远程教育成为可能。与传统教育方式相比,以信息技术为基础的现代远程教育是一种新型的开放性的教育方式,不受教育时间和空间的限制,具有“教育资源共享、信息交流、交互式、个性化教学”等优点,人们可以不受时间和空间的限制,完成随时、随地的交互式教与学活动,不必在指定的地点时间,即可享有的老师、的学校和的课程,并可以随时提出疑问并获得老师的解答,使每个学生得到教育成为可能。他作为信息时代的重要标志而风靡全球,犹如当年的蒸汽机引发的工业革命,全方位地冲击着人类社会的生产、生活及思维方式,同时也对传统教育的变革与发展提供了强有力的物质技术基础。
正如美国思克集团总裁约翰·钱伯思所断言:互连网和教育作为推进社会经济发展的两个核心动力,将深刻地改变一个民族的历史和命运,谁把握了互联网,谁就把握了未来,谁开创了面向未来的教育体系,谁将具有持续发展的能力。基于Web的远程教育能使教师和学生在相隔千里(甚至在不同的国度)之间通过网络实现Face to Face的交流,这无疑会赋予教与学新的内涵,给教育带来深刻的变革,他已受到了许多国家的关注,并成为世界各国教育事业发展的一种新趋势。图1是传统的基于Web的远程教育系统的组成框图。该系统由用户系统、Web服务器、资源库服务器和资源库组成。
![]()
|
然而,目前基于Web的远程教育的效果并不令人满意。纵观现有基于因特网的远程学习应用系统,归纳起来,一般存在如下几个方面的问题。
首先学习交互模式难以满足学习者进行个性化学习这一基本要求;其次,各种模型都存在着动态交互功能不强、系统智能性和适应性较低、系统的测试和评价功能差,无法实现学生按需学习和教师因材施教;再次,现有的网上教学系统基本上都是C/S结构,客户端过于庞大,而且还要进行单独维护。为此,如何设计一个灵活准确、智能化、个性化的远程学习模型,并且解决教育资源在地理上的分布性、各种网络的异构性及学习群体性和分布性等问题,是目前远程教育亟待解决的问题。
2 基于Agent和数据挖掘的远程教育系统的构建
远程教育系统是一个复杂、庞大、不可预测的系统。因此,建立起一个多Agent结构的、跨平台的系统,将大大推进当前网络远程教育的智能化水平。以下结合Agent技术,提出了一种新的B/S模式的远程教育系统。这里B/S(Browse/Server)结构实际上是多层结构的一种形式,是扩展了的C/S(Client/Server)结构,其运行机制采用了标准的C/S分布式处理。不同于传统C/S结构,在基于B/S模式的远程教育系统中,服务器端实现Web服务、应用服务(包括多Agent系统的应用服务)和数据服务,而客户端界面将全部是Web浏览器页面,用户从浏览器端向服务器端提交服务请求,服务器将处理结果通过网络返回浏览器端。这样使用浏览器与某一台主机或系统进行连接,不再需要更换软件或是再启动另一套程序,因而用户界面具备友好性、一致性且易于操作,并为复杂的分布式应用提供统一的环境。
2.1 系统的组成和特点
基于Agent和数据挖掘的远程教育系统的总体结构如图2所示。主要由远程教学管理子系统、服务子系统、接口子系统和人机接口Agent以及多Agent通信结构子系统构成。
![]() |
其中远程教育管理系统包含课件管理、学生管理、教师管理、课件管理模块和系统管理等模块,他们有各自Agent来协助处理,使得整个管理系统更加智能化、规范化,从而实现对整个远程教育系统的管理工作。人机接口Agent是负责处理用户(包括管理员、教师、学生以及其他访问者)访问系统的不同模块的过程控制,接受用户的请求并实现对用户请求处理的结果的显示。如身份确认、权限控制等,并协助安全Agent完成相关的工作。远程教学服务系统主要实现Web远程教育的多个支撑子系统,包括智能选课系统、课程学习系统、智能答疑系统、作业发布系统、在线考试系统、网上交流系统、电子笔记系统等。
2.2 应用服务器的组成和功能
经过以上分析不难看出,基于Agent和数据挖掘的智能化远程教育系统是在图1系统的基础上增加专门的应用服务器,将大量的事务处理逻辑模块从Web服务器中分离出来并分配给应用服务器,由应用服务器承担原来Web服务器的部分工作,这种系统结构降低了Web服务器的负载,消除了Web服务器产生的负载瓶颈,提高了系统的整体负载能力。同时,这种系统结构不仅具有C/S和B/S系统的特点,而且负责业务处理的应用服务器和负责数据处理的数据服务器可以设置为多个,使得大型系统中的应用程序和数据库可以分布于不同的服务器上运行,这些服务器既可以是本地的也可以是远程的,这就使得系统更具有合理性、灵活性和扩展性。
2.3 系统的工作过程
该系统的主要工作过程:访问者通过IE浏览器就可访问系统,根据不同的身份获取不同的权限,并分别进入不同工作画面。一般访问者浏览系统的宣传信息也可以填写入学和入教申请表格,等候管理者的反馈。管理者对各种申请予以处理,设置专业课程和上课时间表,管理系统资源的使用情况,同时根据来访次数和活动考核教师和学生。学生通过Web浏览器可进行选课、课件学习、测试、复习以及查看学习进度等,同时,通过在线交互可向教师提问,也可以用邮件、留言板与教师联系。尤其在学生学习过程中,多Agent系统随时访问学生的学习内容并根据需要做出修改,修改后的新的课程内容再储存到教学数据库中,并利用知识数据库中的信息对学生做出评价。因此,运用Agent技术的远程教育系统充分体现了个性化与智能化的特点。
2.4 信息安全性
远程教育系统的安全,是每一个设计得面临的不容回避的问题,系统中设计为:访问每一个站点的用户都必须提供许可证,经验证授权的用户才能访问。验证用户的身份依据资料的重要程度可采用不同技术,在IIS 5.0中,可采用“基本验证”、“Windows NT口令/回送验证”和“用户端认证身份验证”。“基本验证”通过收集使用者名称和密码和方法来确定用户身份;在“Windows NT口令/回送验证”方式中,使用者的浏览器与网站服务器以特殊密码交换的方式验证身份,实际的密码并未通过网络传送;“用户端认证身份验证”让网络服务器自动辨识使用者的身份,此种验证方式实现较复杂。
3 系统的个性化设计
现在的网络远程教育大多还处于资源共享的状态,只是将传统课堂教育简单移植到远程教育上,教育系统模式单一,以系统自身为中心,没有充分考虑远程教育的教学特点和学生需求,更没有按照以学习者为中心的远程教学规律进行教学,学生只能被动地接受完全相同的学习内容,没有从根本上解决师生互动与网络技术的组合问题,从而没有真正体现出个性化教育的优势。
针对以上问题,应构建一个基于Web挖掘的个性化远程教学服务系统模型。该系统能够充分利用网站上诸如Web logs等信息,通过Web挖掘得到各种有用的规则模式,及时跟踪学习者的学习行为,动态提供适合不同类型学生用户的学习内容和学习建议,实现个性化的远程学习。
3.1 设计思想
个性化远程教学服务的根本宗旨是尊重学生用户,研究用户个人学习行为习惯和兴趣,为用户选择更需要的学习资源,提供更好的教学服务。其系统设计思想是:对学生的个人信息、学习行为信息、学习成绩记录信息、答疑信息,作业完成信息及Web日记数据,利用数据挖掘技术找出有用的规则、模式进行综合分析,结合教学资源知识库的信息,自动组合学习内容和进度,重构页面的链接,针对不同的学生提供不同的学习内容和学习模式,做到因材施教。
总之,在个性化远程教学服务系统中,学生用户登录后,呈现给用户的学习界面不再是千篇一律的,而是与其个人密切相关的个性化学习环境。某个学生用户从登录系统到退出的整个学习过程中,所有的学习操作行为及其结果都被及时记录到数据库中,供下次登录学习时系统产生用户界面作参考。
3.2 Web挖掘的关键算法
3.2.1 基于神经网络的用户聚类算法
在该系统中,通过对Web日志进行数据清洗,可获得数据源,对该数据源扫描建立用户会话,在相同一次用户会话中,如果用户访问了网站的多个页面,则该会话可用一个n维向量表示,其i维向量值为用户对第i个页面的兴趣度,也称权重。这样,通过Web日志文件提取的用户访问信息,可以用模式向量表示出来。由于Kohonen神经网络具有良好的聚类特性,可用该方法对用户访问模式向量进行分析。
假设输入向量为X=(x1,x2,…,xn)T,输出神经元i与所有输入神经元的连接权值向量为Wi=(Wi1,Wi2,…,Win)n,(i=1,2,…,n),则连接权值向量与输入向量距离短的输入神经元NS就是竞争获胜神经元。如下表示:
![]() |
式(1)中‖x-ωi‖为向量的距离,他有许多不同的度量方法。可以选择欧几里距离、明考斯基距离或者夹角余弦等。Kohonen网络的输入神经元的新连接权值(即获胜神经元的权重训练方法)如下:
![]() |
式(2)中G(t,‖x-ωi‖)是调整系数(迭代函数),i,j分别表示输入向量和输出神经元的序号,权值向量是被随机初始化的。训练结果将权值向量逐渐靠近输入向量,经过一定数量的训练后输出的获胜神经元可表示不同用户的模式向量所属聚类。
综上所述,给出Kohonen算法如下:
(1) 初始化。使用小的随机值初始化Kohonen网络权值,并选定邻域大小;
(2) 输入模式。从样本集中选择一个样本(x1,x2,…,xn)作为Kohonen网络的输入;
(3) 计算距离。计算输入向量与所有输出神经元连接权值向量间的距离;
(4) 选择获胜神经元。将连接权值与输入向量距离近的神经元作为竞争获胜神经元;
(5) 调整连接权值。按式(1)调整Kohonen网络的输出神经元连接权值;
(6) 回到步骤(2),重复(3),(4),(5)各步,直到Koho-nen网络进入稳定状态。
3.2.2 频繁项目集与关联规则的发现
在个性化远程学习系统中,对事务文件的挖掘,可得到用户访问的频繁项目集和关联规则。这些规则反映了不同用户的共同访问模式,可以直接用来改进Web站点设计和重组教学内容。可以使用Apriori算法来挖掘频繁项目集与关联规则模式。该算法首先产生满足支持度约束的频繁项目集L={l1,l2,…,ln},然后由L产生关联规则,其中sup为XUY的支持度,conf=sup(xUp)/sup(x)为规则的置信度。
3.2.3 频繁路径挖掘算法
遍历路径指的是在用户会话中请求页面所组成的序列,这种序列对个性化教学系统的站点组织管理很重要。从站点的组织来看,总希望用户浏览行为与页面间超链设置相一致。设会话集为S={s1,s2,…,sn},路径集为P=<u1,u2,…,uv>(其中ui∈站点的url页面集U={url1,url2,…,urln})。包含频繁遍历路径的用户会话的数目叫支持度。路径p在s中的支持度为sup(p)= |{s/s∈S且p在s中出现}|/n,路径挖掘就是要找出支持度大于小支持度min sup的路径,称为频繁路径。
4 系统的实现
考虑到远程教育系统的分布特性和开放性,我们采用方便维护升级的基于Web的浏览器/服务器模式,学生客户端采用IE或Netscape标准浏览器,服务器端采用Win-dows 2000 IIS 5.0 Web服务器,信息发布系统采用VB-Script 和ASP脚本网页数据库交互式应用技术开发,部分网页采用Java Script技术实现,后台数据库采用SQLServer 2000管理各种数据表格,智能导航算法和搜索教师Agent以及学习效果自我评价、考试测试系统都是采用ASP和ActiveX技术开发的。访问权限管理除了一般的用户名、密码验证外,还增加了IP地址访问权限管理以及S-HTTP编码传输技术。开发工具采用Microsoft Inter-Dev和FrontPage。在个性化跟踪方面我们采用基于MSAgent的角色编程技术,并与ActiveX控件相结合,给予学生以各种人性化的提示和引导。超级管理员、教师和学生分别进入不同的权限画面,并可进行教学资源管理和讨论交流等细化分工。
5 结 语
随着人工智能和信息技术的发展,智能化、个性化的网络远程教育模式将成为未来教育的主要手段,利用Agent和数据挖掘技术来构建Web远程教育系统将成为现代远程教育系统开发的一个热点。本文介绍了Agent的技术优势,并给出了一个基于Agent和数据挖掘的Web远程教育系统框架。与其他远程教育系统相比,基于Agent和数据挖掘的远程教育系统使系统的负载能力、灵活性和智能性等都得到提高,从而较好地满足了现代Web远程教育的需求。当然,为了更好地实现系统之间的协作性和互操作性,今后还需要在诸如系统的安全性、系统的跨平台性等方面做进一步地研究。