近些年,不少高校陆续进行了专项数据治理工作,在促进数据质量的完整性、准确性等方面取得了一定成效的同时,也暴露了一些问题。
本文总结了目前的高校常见数据治理模式、方法、路径,探讨了如何利用互联网+的思想重塑整个数据治理体系,提出了以大数据、人工智能等新技术构建用户自治理模式的校园数据治理体系,从而有效提升数据质量,满足下一代智慧校园建设的需要。
高校数据治理范畴
从数字校园到智慧校园建设演进的过程中,数据质量问题成为困扰广大教育信息化工作者的一个难题。数据治理(Data Governance)是保证数据质量的必需手段,加强数据治理提升数据质量已成为教育信息化工作者的重要任务。
如何通过数据治理解决数据的完整性(Completeness)、规范性(Conformity)、准确性(Accuracy)、唯一性(Uniqueness)、关联性(Integration)等多方面的问题,从技术层面到管理层面多个方面,先行者已经做了很多探索。
数据治理是指在数据资产价值创造的过程中,治理团队对数据资产管理的评价、指导和控制,核心是加强对数据资产的管控,通过深化数据服务,持续创造价值。
数据治理工作包括:数据生命周期管理、数据安全管理、数据质量管理、元数据及数据模型管理、数据标准管理。
在大数据时代,高校数据治理的范畴包括主数据、业务数据、分析数据等全量数据。新一代的数据治理,需要用更智能化、现代化的方法实现服务广大师生的目标,帮助学校实现数据标准构建、数据模型设计、数据协同机制、数据服务的全过程。
目前高校数据治理框架主要包含三方面内容:
第一,有效的高校内部数据标准体系,包括数据标准、管理标准、质量标准等内容,并保证各业务部门、各业务系统能得到落实与管控。
落实到治理工具上,主要体现在元数据管理功能是否得到详细认真的设计、应用,助力于业务系统。例如,元数据中除了应设有国标、行业标体系(如地理、行政区划,学科门类、专业等)的数据之外,还应涉及应用系列校标数据,如建筑物、楼宇体系等。
第二,完成各业务系统的整合工作。完成用户集成、数据集成、业务集成工作,消除信息孤岛,完善数据中心建设。
首先,尽可能在被集成的业务系统,即产生数据的源系统中解决数据质量问题,这对于整个体系的数据治理来说是非常高效的措施。
其次,在各业务系统及平台的建设过程中,描述核心业务实体的数据,如教师、学生、教学、科研、资产、财务等,交换、共享性要求较高,均要被纳入到主数据范围,形成全校范围内一致的、完整的、准确的核心业务数据,由数据中心统一对外提供数据服务。
最后,落实到数据治理平台上,集中反映在主数据管理是否完备,是否能以多种数据共享形式服务于各类应用。
第三,评估数据质量,生成数据质量报告。以数据标准体系为基准,以数据治理平台为工具,数据管理员对整个主数据(或者全量数据)质量检测,根据实际需求,利用检测数据进行单一主题或者整体进行数据质量分析,生成数据质量报告。在数据质量报告的基础上,结合系统配置好的数据管控体系,生成针对部门、业务数据管理员的各子数据集整改报告。
在治理驱动路径选择上,目前很多高校认同自上而下的驱动形式,成立分管领导甚至主要领导牵头的工作小组,以强大的行政力强力推动,取得了不错的成效;也有的学校以信息部门为主进行驱动,聚焦于解决具体问题由点带面自下而上的形式,从而在较小的投入下取得成效。
数据治理存在的问题
业务闭环未形成,内生驱动力缺乏
对于信息部门来说,数据治理就是把系统生成的数据质量报告分发给各部门,因为不触及业务,在其他方面也很难着力。对于业务部门来说,数据治理就是按照信息部门交付的整改报告,录入、审核、调整数据;此外,要求广大师生在各业务系统终端录入、核验个人数据,核验用户数据是否真实准确也非常繁复。
治理工作阶段性完成后,通过数据平台以多样化的数据服务形式提供给广大师生使用。数据治理受益最明显、最直接的是广大师生,数据治理也往往先从师生聚焦的共享性高的数据子集开始,如教学、科研、人事信息等等。
图1 传统数据治理过程
但在数据治理过程中,参与感最低的却是师生。师生在具体业务场景使用数据的过程中,发现的数据质量问题,又很难有及时、有效的机制,完成从反馈到整改的整个业务闭环,从而使用户体验很差(如图1所示)。
运动式治理,很难形成长效机制
因为内生驱动力不足,目前高校数据治理主要方式可以形象地称为“运动式”。领导动员强调,信息部门三令五声要求,业务部门加班加点落实,数据质量得到有效提升。但是,治理周期一过,数据质量马上下滑。
这个问题不可避免,因为业务数据不断产生,数据治理工作无法一蹴而就,如果没有长效机制保障,数据治理永远在路上。
重治理,轻服务
数据与服务,两者相辅相成,互为依托。数据治理,是一项基础性、长期性的工作。在数据服务需求不明确、不突出时,单方面推进数据治理,困难极大,成效也很难凸显。有成效一类,解决问题一类,从而逐渐突破,提升数据质量。
无法满足智慧校园建设要求
目前数据治理工作均基于传统数字化校园体系开展,由相关人员围绕业务系统、数据中心进行数据治理,各系统均为传统管理信息系统设计思路,以面向管理的方式开展工作。
在下一代智慧校园建设过程中,业务系统开始逐步被微服务体系解构、替代,广大师生更加注重于基于大数据、人工智能等新技术环境下面向服务体系架构的用户体验。新的技术架构、新的服务场景,数据治理如何开展,也到了亟待变革的时候。
构建用户自治理模式的数据治理体系
To B还是To C,这是一个问题
数据治理,从名称上看就是典型的管理信息系统思维模式的产物。治理就是一项管理工作,就需要管理部门的介入,被治理的,就是广大普通用户,在高校就是广大师生。
在各种服务使用的过程中,互联网公司不知不觉的完成了数据治理工作,以To C将庞大的数据采集需求分散到各种微小的服务中,并且马上让用户有获得感,润物无声地完成数据治理工作。
图2 服务引领,用户自治理的数据治理模式
高校信息化产品、服务的设计,传统To B思维居多,买单的是学校管理部门,设计思路自然也围绕管理人员展开,也导致了上述许多问题。数据治理最终受益的是广大师生,数据治理产品是To B模式还是To C模式设计,这是根源性的问题。只有以用户为中心设计产品、体系乃至整个解决方案,才能真正获得用户的认同(如图2所示)。
智慧校园的数据治理产品、方案设计,也应该以业务需求为牵引,在微服务应用的过程中便可以完成数据采集、修订等工作,同时在数据管理人员支持下,以大数据、人工智能的技术手段为依托,厘清个人数据、业务数据、主数据的关系,适时写入主数据,形成业务闭环,实现围绕师生为核心的需求、治理、服务的全业务闭环体系,完成整个治理过程。
业务的应用每时每刻在进行,数据的治理工作也一直在进行,从而杜绝运动式的数据治理模式,保持数据质量稳定。
目前,已经有从事高校信息化领域的公司开始以To C模式,围绕广大师生需求为核心设计、推广相关产品,取得了不错的效果。
构建多维运营体系促进数据质量的提升
如何围绕广大师生需求,做好数据治理工作,相关运营体系的建立是必然趋势。构建起从广大用户、业务系统管理者、数据中心管理者多角色参与的运营指标体系,从问题解决率、解决时效、数据质量等方面建立关于以上多角色的评价指标,通过系统记录、跟踪数据治理整个过程,持续进行整改优化,必要时进行一定的考核,持续促进数据质量提升。
在数据采集、填报的过程中,传统形式均为手工录入方式,由用户或者管理人员录入相关信息,形成最初的数据来源。实际上,因为技术方法的进步,很多数据可以用更方便的方法获取、组织管理起来,从而大大节省工作量,提高治理效率。
如元数据信息,通过网络爬虫、自然语言处理、人工智能等算法,实现知识提取;未来可自动构建成起知识图谱,利用智能搜索、关联查询手段,为师生自动化提供更加精确的数据,高效率、智能化完成数据治理工作。2018年4月,教育部正式印发《教育信息化2.0行动计划》,推动教育信息化从融合应用向创新发展转变。不同于以信息技术(Information Technology)为基础的教育信息化1.0,教育信息化2.0以数据技术(Data Technology)为基础,将一切参与主体、教育元素、教育行为数据化将是教育信息化2.0的基本特征。
我们需要思考,如何推动教育信息化从传统业务的融合应用向创新发展进行转变。教育信息化作为一个竞争不充分、发展落后的细分行业,相关从业者一定要认真关注各种新技术的发展,思考其在高校落地的具体结合场景,要打破头脑中思想的桎梏,吸取优秀行业经验,探索互联网思维在校园信息化中的应用与实践,这样才能真正做出师生有感知、有温度的产品、方案,才能真正提升高校信息化水平。
文章来源:中国教育网络
作者:陈伟
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。