互联网+
联系我们
  • 中心总机: 6878 2002
  • 网络报修: 6878 7212
互联网+
当前位置:首页>>互联网+
智慧校园背景下的教育大数据生态体系建设
jsjjyk    发布时间:2018-09-28  阅读次数:



随着“互联网+”技术的不断革新,大数据应用 服务在物联网及公共服务等领域遍地开花,产生出较 好的社会效应和巨大的社会影响。近些年,基于大数 据的研究快速延伸到象牙塔,对高校智慧校园的建设 与发展提出了更深层次的要求。伴着高等教育改革的 不断深入,高等院校由数字化校园向智慧校园演进已 是社会发展的必然趋势。当前,全国众多高校正如火 如荼开展“移动互联网”“大数据 + 教学/科研/管理/ 服务”“云计算”“软件定义网络(SDN) + 网络功能虚 拟化(NFV)/网络定义安全(SDS)”“虚拟化应用服务” 等新兴技术的研究与应用,旨在为师生、行政管理人 员提供合理化地管理、精细化地服务、智能化地应用 及科学化的决策。 


在持续化的信息化建设与应用中,高校已累 积了丰富的教学、科研、管理、服务等方面的“小数据” ,小数据集为教育大数据的深层次研究 提供了夯实的多维度数据基础。同时,传统流程化 的业务模式沉淀出大量的结果化数据,加上过程化 的机器日志数据,逐步衍化为价值巨大的优质数据 资产。智慧校园的核心任务是实现教育大数据的反 哺,使得高校由“以事物为核心驱动应用(封闭式的命题)”逐步向“以数据为核心驱动应用(开放式 的命题)”转变,让教育大数据成为创新精准服务 的基石。



1.数据源的多样化:数据源自学校各级机构, 重点围绕师生、横跨教学科研、管理服务,所有的 业务流程能够产生丰富的过程化数据,最终转化为 结果化数据。过程化数据逐渐被用户重视,成为感 知用户个性化的重要数据源。


2.数据异构维度高:教育数据体量一般,但异 构性强、跨度大、维度高、含义丰富。维度数据源 多,数据能够更加准确的定义个性化服务,极大的 提升用户的无感知体验。 


3.数据类型多样化:除结构化数据外,半结构 化、非结构化数据规模庞大。教育大数据由结构化 数据为主导逐渐向半结构化数据、非结构化数据为 主导进行转变。 


4.数据整体价值高:单一的“小数据”意义甚 小,但整体数据可描绘全局。小数据作为大数据的 支撑,能够产生个体性的过程化小数据,从而构建 全局性的维度化大数据。



中国高校信息化发展历程普遍经历了“底层 设计”“基础建设”“应用推广”及“服务提升” 的四元化阶段。教育信息化的实施亦是不断促进信 息化全方位辅助高校教学水平、科研模式、管理手 段、服务精度及决策能力的全方位提升。当前, 教育大数据的应用水平和应用程度是标志高校向 “创新发展型”“世界一流化”大学迈进的重要指 标。开展对教育大数据的深度研究与思考,从本质 上是为了实现全面的解放与提升,让智慧化的成果 受惠于高校的主体对象,其研究意义主要体现在以下方面,如图1所示。

 


1.解放高校“重管理、轻服务”的“以管理为 主、用户感受为辅”管理模式,实现管理体系中管 理者的“去行政化、去权利化、去一元化”;


2.解放高校“重讲授、轻反馈、轻实践”的 “课堂为主、课后为辅、实践能力弱”教学模式, 实现教学体系中学生角色的“个性化学习与自主化 学习”; 


3.解放高校“屁股决定脑袋”的“拍脑袋式” 决策模式,实现决策体系中决策者的“数据化决策 与智能化决策”;


4.解放高校“重流程、轻效率”的“跑断腿、 折断腰、处处碰壁式”的服务模式,实现服务体系 中对服务对象的“精细化服务与一站式服务”。 


当前,智慧校园的建设仍在数据管理与应用 等方面存在诸多问题,构建大数据生态治理服务体 系(本章节中简称“体系”)旨在利用虚拟化、云计 算、人工智能、数据挖掘等技术,将高校各类过程 化、结果化的数据通过采集、清洗、分析、存储等 流程,加以高效的组织与科学化管理,使其被最大 化的挖掘与利用,最大限度的释放数据红利。通 过数据应用为导向开展数据治理可以有效降低数 据治理的难度和风险,以致于更好地提升高校在教 学、科研、管理、服务、决策等方面的能力。




为了较为客观地了解我国高校教育大数据的建 设及应用需求,结合高校智慧校园建设发展需求和 服务需要,针对不同规模、不同类别、不同等次的 高校大数据(生态)体系进行了调研,选取了国内双 一流A类高校清华大学、复旦大学、武汉大 学;双一流学科高校华中农业大学、南京理工大学、中国矿业大学、中国地质大学(武汉);普 通本科高校中南民族大学、湖南农业大学、常 熟理工学院等三类高校为样本。 


尽管上述10所高校在教学、科研、管理、服 务水平方面存在较大的差异,但从当前的教育大数 据发展现状以及智慧校园中、长期的发展目标分析 (如表1所示),存在如下共性问题(如表2所示)。


 

 


 


通过分析10所样本高校教育大数据发展现存的 共性问题,结合样本高校教育大数据的发展目标, 开展基于教育大数据生态体系的数据应用与服务模 式的探讨与改进是智慧校园的发展的自然选择,亦 是互联网模式新信息化环境下应用需求催生的新 趋势。经调研总结,结合上述10所高校教育大数据 (生态)发展现状,围绕其智慧校园的发展模式、应 用场景与发展思路,将教育大数据(生态)体系应用 与服务模式划分为水平化与垂直化两类,如表3和 表4所示。


 

 


表3中,基于高校教育大数据生态体系的水平 化应用与服务模式被划分为三类:支持“精准管理”的数据应用与服务模式、支持“科学决策” 的数据应 用与服务模式、支持“综合评估” 的数据应用与服务 模式。水平化的划 分方式,主要从校 务职能的角度入 手,围绕提升“教 学、科研、管理、 服务”四大类主体 工作水平为目标。 通过教育大数据 (生态)体系在校务 职能上的全方位应 用为载体,创新发 展模式、提升治理 能力、强化管理意 识、简化办事流 程、开创一流服 务,推进智慧校园 建设的快速落地。 


在上页表4中,基于高校教 育大数据生态体系的垂直化应用与服务模式被划分为 四类:支持“学校全局”的数据应用与服务模式、支 持“学科发展”的数据应用与服务模式、支持“院系 业务”的数据应用与服务模式、支持“大学事务”的 数据应用与服务模式。垂直化的划分方式,主要从自 上而下的逻辑层次关系入手,围绕高校的机构单元职 能开展大数据应用与服务模式探索。通过教育大数据 (生态)体系在层级式的机构单元职能方面的全面应用 为切入点,不断推进智慧校园建设中释放数据红利为 核心,辅助提升高校现代化的治理能力为契机,构建 长久的教育大数据(生态)体系发展规划为任务,健 全科学的决策管理为目标。



通过对上节中的高校教育大数据应用现状调 查,智慧校园背景下的教育大数据生态体系的核心 工作流程可归纳为:理清(数据)源头 -> 规范(数据)标 准 -> 优化(数据)质量 -> 促进(数据)共享 -> 开展(数 据)分析 -> 挖掘(数据)价值 -> 生成(数据)应用 -> 反 馈(数据)源头。教育大数据生态体系的构建,旨在 加快教育大数据与高校各类应用之间的深度耦合, 重构教育数据服务基础架构,建立层次化数据服务 与管理体系,形成拥有良性循环机制的数据生态环 境,进一步实现高校的信息化应用模式由“粗放 式、大一统”向“精细化、个性化”的转变。 


基于上述分析,教育大数据生态体系架构设计为“一源(数据源)”+“一平台(大数据平台)”+“一 端(用户端)” 的三级架构模式(如图2所示)。

 


 

 


底层的“数据源” 是体系架构的基石。该层 主要完成高校内部以业务数据为主的结构化数据, 以文本、音视频、机器数据(日志数据)为主的半结 构化数据与非结构化数据、外部互联网数据的采集 工作,依靠ETL工具、 Flume日志处理集群及Ruby 爬虫引擎进行数据预处理,实现对各类数据有序且 规范化地梳理、采集、清洗、标准化规范存储和应 用,为中间层“大数据平台”所需的多维度的数据 交换、计算与挖掘服务提供干净且可靠的数据源; 


中间层“大数据平台” 是教育大数据生态体系的 核心层。该层基于目标应用开展对多源数据的样本分 析、建模、多维度数据抽取及规则库的定义和递归优 化,依托Hadoop数据仓库集群工具(Hive/Pig集群)、分 布式应用程序协调服务工具(ZooKeeper集群)、大规模 数据计算处理工具(Spark计算集群)、分布式存储工具 (Hadoop集群)等完成对实时及离线结构化、非结构化 数据集全面的存储、交换、计算、分析、挖掘,实现 异构数据的归一化处理,为上层“用户端”的数据应 用报表呈现、个性化的需求服务推送、智能化的分析 评估、科学化的决策定位提供坚实的依据。 


上层“用户端” 是实现数据的可视化输出。根 据用户的属性特点和个性化需求,为用户推送与其 相关的知识服务信息。



信息化发展所面临的新挑战与新机遇,驱使高校的体质改革向更高的要求推进,高校改革的核心 要素主要体现在: 


1.管理治理:在技术上实现 管理体系的“去行政化”,以顺 应高校从“管理”走向“治理” 的良性发展趋势。


2.服务治理:从学校行政 服务规划着手,梳理与整合业 务流程,以完成流程的再造从 而提供更为明晰化的服务。


3.数据治理:构建数据资 产平台,提高针对全生命周期 的数据治理能力,为后续教育 大数据的应用创新提供基础。 


针对改革的三项核心要 素,教育大数据生态体系的主 要工作表现为: 


1.流程协同方面:进一步 厘清高校各类管理流程及形式 转变,采取高效便捷的工作流 引擎,快速配置及部署实施。 


2.服务模式方面:进一步构 建业务与服务的“标准化”“耦 合化”及“碎片化” ,定义标准 的服务接口,建立服务化的数据 驱动模型,将服务端独立于后 端,开发和推广采用统一、创新 技术,以达到服务模式与需求应用的深度融合。 


3.数据基础方面:进一步建立更为完备的数据 管理和服务机制,完善各种数据采集、交换、分析 和利用,以较低的经济陈本和学习陈本交付给业务 应用主体(用户)。 


教育大数据生态体系模型的构建过程,实际是 充分利用虚拟化、云平台、云计算等信息化技术和统 计、在线分析处理、情报检索、机器学习、专家系统 和模式识别等计算机技术,将高校各类数据通过采 集、处理、利用加以高效地组织和科学化管理,并 在流程服务中得以有效应用于教学、科研、校务管 理与决策的全过程。教育大数据生态体系不单是相 关技术的集合,更是智慧校园发展过程中衍生出来 的一种应用思路,是一种使用全量数据的意愿和能 力。如图3所示,智慧校园中的教育大数据生态体系 的核心环节可被理解为是一条全生命周期的“应用 闭环流”, 本文将其定义为“教育大数据应用氛围 视图” 。多维度的数据源经过原始数据采集 -> 数据 整合 -> 数据分析 -> 数据加工 -> 数据展示 -> 输入反馈 -> 回溯至数据源的迭代过程,逐步构建起良性的 大数据生态环境。


 

 


基于教育大数据应用氛围视图,智慧校园中的教 育大数据体系模型可理解为是一条环回的“逻辑单元 流” 。 如图4所示,教育大数据体系模型由以下 6个单元构成。其中,单元1至单元6以逻辑承接的方 式,构建起闭环式教育大数据生态体系模型。 


 

 


单元1: “顶层设计”单元 

 

顶层设计单元应建立在大数据生态体系链的顶端, 是体系的纲领性部分。该单元主要完成对整个高校教育 大数据发展规划的制定、建设目标的定位以及对数据标 准(包括环境规划、管理策略、管理措施)的统筹。 


 

单元2: “基础条件”单元 

 

基础条件单元是高校构建体系的底层建筑。该单 元包含建设资金的合理化调配、数据管理/治理/监控过 程中专技人员队伍的构建、体系制度的建设及构建体 系过程中一系列数据分析、应用工具的配备。 


 

单元3: “数据环境”单元 

 

数据环境单元是数据治理、数据分析挖掘与数据 应用最为关键的基础环节。要做好数据治理,必须先 厘清业务服务流程、梳理业务生命周期、规范数据字典类型及数据标准。统筹协调业务部门,制定各类数 据源的业务归口,建立数据交换与共享标准。其次, 构建业务流程的数据服务模型和数据对应关系,建立 数据服务的基础架构。最后,设计基于用户角色服务 的“一站式”服务框架,为数据治理提供支撑。

 


 

单元4: “数据治理”单元 

 

数据治理是体系生命周期“业务流” 中最为核 心的部分,包含对数据质量管理、数据安全管理、 数据全生命周期管理及数据质量的监控。 


数据质量管理是基于数据操作、数据共享与数 据服务的统筹化治理,通过构建多维度元数据模型 实现对数据共享关系的管理,实现对权威数据源的 核查,对数据交换与共享过程中的脏数据、冗余数 据进行清洗。 


如图5所示,数据安全管 理是在数据交换过程中,杜绝 对 源 业 务 数 据 原 表 进 行 写 操 作 , 数 据 交 应 基 于 共 享 数 据 平台通过数据集成工具(ODI、 WebService等)以接口方式将信 息系统需要的字段信息抽取到 中间表或视图中,为大数据分 析和数据服务管理提供可靠的 数据支撑。在开放数据服务的同 时,健全数据脱敏安全管理体 系,实现对敏感数据和关键数据 的分级与分类保护。


 

 


数据全生命周期管理包括对数据的“发生—传 递—分析—呈现” 过程的全周期管理,通过构建合理 的数据架构体系,在数据业务流推进的过程中,保证 数据源可靠、数据传递畅通、数据分析精准、数据呈 现可读。 


数据质量的评判标准具有及时、完整、 一致、有效、准确五大特性。围绕五大特性 对接口数据、数据仓库层面的数据质量进行 监控,建立业务数据监控规则,动态监测并 报警体术数据异常。 


 

单元5: “数据分析与挖掘”单元 

 

业务不仅仅是独立存在,数据交换解 决了数据孤岛的问题,但没有发掘数据价值 的能力。数据分析与挖掘单元的主要工作是 开展对不同业务系统产生的多维度过程化数 据、结果性数据进行采集、抽取、清洗、关 联、分析,实现应用与数据的全“解耦” , 提升数据的“可复用”度。 


 

单元6: “数据应用”单元

 

 数据应用即是数据红利的释放,利用数 据分析与挖掘部分的成果,不断提升高校管 理者的科学决策水平,实现全面精准化的管 理,辅助高校增强教学、科研、管理、服务能 力,为建立师生个性化的综合服务体系提供支撑。



教育大数据生态体系的建设目标旨在实现“构 建教育大数据的各个组件标准规范”“参与教育大数 据的各个部门密切配合”“进入教育大数据的各个环 节良性循环”“服务教育大数据的各个对象全面入 微” 。高校紧密围绕自身的发展需求,不断促进智慧 校园创新应用,最大限度的挖掘数据价值,进而提升高校治理能力、推进高校治理体系的现代化发展。尽 管高校教育大数据生态体系源于应用、管理、服务, 但应在应用、管理和服务之上,是智能化、科学化、 统筹化智慧校园的集中性体现,为高校全方位“精准 管理、科学决策、综合评估”提供保障。