高校普遍存在的數據問題
由於早期數字化校園建設背景的限製,各大高校在數據層麵均處於較為薄弱的階段,主要存在以下難題。
1.數據不可知
傳統的數據平台僅含部分人財物等結果型主數據,並不包含過程數據,無法得知真實的數據資產情況;
2.數據不可管
缺少對於多源異構數據的可視化處理平台,對廠商的依賴程度較大,難以擁有自主權;
3.數據不可控
數據開放程度不足,同時缺乏數據全脈絡的監管,不能規範數據的全生命周期流程;
4.數據不可信
信息標準不一致、數據不完整、數據錯誤等問題造成數據不可信,導致分析結果的偏差,影響數據的共享交換;
5.數據不可用
缺少對於業務場景的研究,很難產生實際價值。
當前,智慧校園建設對於底層數據的需求更為急迫,因為沒有準確全麵的數據,智慧校園就無法達到預期的高度。
因此,南京理工大學啟動了數據治理體係建設,以數據的“采、管、用”為目標,以全量數據中心建設和數據中台服務為依托,旨在提升智慧校園數據服務能力,為學校提供全麵、高效、精準的數據支撐。
數據治理體係建設實踐
1.構建校級的數據管理組織架構
數據治理需要率先建立管理的組織架構,明確決策流程、權責關係、配合方式。學校建立起重大決策和協調推進、技術開發支持、承擔配合的數據治理體係,保障了數據治理工程的快速推進。
2.製定學校數據標準規範
數據標準規範是智慧校園頂層設計,能夠保障數據的一致性,破除數據難以打通、利用等弊端。
通過部門調研、比對迭代,形成權威信息標準。基於統一的編碼規則,為數據的全麵打通和業務係統實時同步更新數據標準奠定了基礎。
3.數據資產摸底與識別
學校提出並實踐了“先集中、後治理”的數據治理方式,即建設近源數據層,將數據的原始形態充分進行暴露和識別,從而實現數據資產的盤點,形成對於數據資產管理的統一視圖。
4.構建全量數據平台
智慧校園建設需要更多高價值數據源,例如記錄行為的日誌數據、線下表格數據、外部互聯網數據,以及視頻監控和人臉識別等非結構化數據。此類數據的體量、結構、處理方式與業務數據完全不同,存在很大的使用難度。
為實現低門檻的利用,學校設計了全量數據平台架構(如圖1所示),能夠支持多維數據源,實現高校全量數據的“實時可采集、全麵可管控、處處可複用”,真正實現“數入一庫,數出一庫”。
圖1 全量數據平台架構
(1)業務數據
新建的業務係統不再單獨構建數據庫,原有業務係統按11備庫到全量數據中心。
實現了招投標係統、智慧團建、第二成績單等12個新建係統數據集中存放;實現了對人事、學工、教務、科研、資產、研究生、一卡通等25個核心係統數據的全量采集和治理,生成了學校概況、學生管理、教學管理、教職工管理等13個數據倉庫子集,共計沉澱5億多條結構化數據。
(2)日誌數據
基於Hadoop和Spark大數據框架,實現了對上網URL、防火牆、無線Wi-Fi、WAF等7大類核心日誌數據的分布式采集、解析、存儲工作,月體量近TB級。
針對此類高校普遍未有效利用的行為數據構建了成熟的處理方案,為大數據應用提供了多維度數據源。
(3)線下數據
設計並落地了對學工處、人事處、教務處、國資處等10個部門線下表格數據的一站式采集治理方案,在兼顧部門人員維護數據習慣的基礎上,實現線下數據源的補充。
該方案為高校審計數據上報工作提供了便利,為各大高校業務係統未建或使用效果不好,又需要將線下數據進行整合和共享的需求提供參考。
5.推動數據質量回溯,堵疏並用
對於數據質量這類老大難問題要綜合評估其影響程度、改進難易度,製定了以下解決辦法。
(1)明確數據源頭部門,提供可視化數據質量報告
對於影響範圍較大的主數據,采用可視化數據質量報告推送的方式,讓源頭部門明確數據質量問題,並對原始問題記錄進行重點標注,推動其核對和改善。
(2)推行數據與人見麵
遵循“個人對數據負責”的原則,建立師生個人數據中心,提供糾錯補錄功能。通過集中式的個人數據查閱和核對,保障個人數據更新的及時性,為各類業務申報提供可信數據源,避免重複填報。
(3)推動業務係統整改
業務係統設計的不完備性是數據質量問題的根源,學校製定了數據治理提升措施,實現從源頭解決數據質量問題。
6.打造數據中台,以開放促應用
為構建更為開放的數據服務生態,學校設計了集 “發布、申請、管控、監測”為一體的數據中台(如圖2所示)。
圖2 數據中台
統一發布中心:麵向各平台和係統提供統一的數據出口方式,可快速實現數據共享接口的發布,降低數據共享門檻;
統一申請中心:繼承數據治理的成果,開放校內數據資源目錄,目前已有近20類、400+種數據資源上線使用;
統一管控中心:可視化處理數據申請,從而保障學校對於數據的自主可控;
統一監測中心:對於數據運行情況實現全鏈路監測,改變以往數據交換的“黑盒狀態”。
7.麵向業務場景落地大數據分析應用
大數據分析的建設不能閉門造車,要深入了解各部門、各群體的真實需求,以精準的大數據分析結果全麵輔助領導決策、校務管理及流程優化,推動學校的長遠發展。
目前,已為人事處、學工處、校友會、後勤服務中心、校園管理與保衛處、發展規劃處等部門提供大數據分析服務,以下是部分亮點應用。
(1)暖心飯卡
通過分析食堂消費數據實現精準扶貧,將善款直接打入進餐低於平均水平的學生飯卡內。在保護學生尊嚴的前提下,保證困難學生能夠吃飽飯。
(2)智慧網絡
基於產生的海量曆史數據和實時數據,實現IT資源運行分析、異常檢測、智能預測等功能(如圖3所示),解決高校IT架構複雜、運維困難的問題,提升學校基礎IT運維能力。
圖3 智慧網絡
近年來,如何在破解高校數據頑疾的基礎上,充分挖掘和發揮大數據的價值,是高校信息化領域麵臨的新課題。
南京理工大學通過數據治理體係的規劃和實踐,打造了以全量數據中心和數據中台服務為核心的智慧校園數據支撐體係,為當前和未來信息化建設提質增效夯實了數據基礎。
本文以此為例簡要分析了高校數據層麵普遍存在的問題,提出了對應的解決辦法,在高校業務特性的基礎上,提出一個可借鑒的高校數據治理路線,為各高校的數據治理建設提供參考。
(作者:南京理工大學信息化建設與管理處 塗慶華 崔聰 束乾倩)
進入專題>>2019高校信息化創新實踐方案展示
① 凡本站注明“稿件來源:beplay2网页登录”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2网页登录”,違者本站將依法追究責任。
② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。