您好, 訪客   登錄/注冊

基于大數據技術高校檔案開發利用與信息服務研究

來源:用戶上傳      作者:

  摘 要  高校檔案資源具有較高的學術價值、經濟價值和社會價值,充分開發利用有利于促進社會經濟和文化的發展。大數據技術作為當前最先進的數據分析技術已經在很多領域內產生了巨大而深遠的影響。利用大數據技術能夠深度開發海量數據,同時為檔案信息的服務創造新的空間。
  關鍵詞  大數據 高校檔案 檔案管理 檔案開發 檔案信息服務
  中圖分類號 G273.5 文獻標識碼 A 收稿日期 2018-11-09
  Abstract College archives resources have high academic value, economic value and social value, and the full development and utilization of them can promote the development of society, economy and culture. Big data technology, as the most advanced data analysis technology, has produced huge and far-reaching impact in many fields. With the big data technology, a large amount of data can be deeply developed and a new space for archival information service can be created.
  Keyword big data; college archives; archives management; archives development; archival information service
  據最新教育部發布的《中國高等教育質量報告》,新中國成立至今高校畢業生人數為8400萬,2018年在校大學生人數3700萬,巨大的數字必有巨大的數據,如何利用好如此巨大的數據,在很長時間里,都是一個巨大的難題。以傳統的方式,如此海量的數據僅管理就十分耗費人力和物力,根本沒有更多的力量去開發它們,因此它們只能沉默,沉默在各大高校的檔案室里。自從有了大數據分析技術以后,這一難題已經得到了有效的解決,隨著科學技術的進步,未來數據分析的成本將大幅度地降低,屆時高校檔案開發和服務將上升到新的階段。
  一、大數據技術與檔案開發
  大數據技術是近年來最受關注的科技話題,實踐證明,它不是一個空洞的科技概念,而是一種切實有效的分析技術,它已為各行業的發展提供了切實有效的服務。于高校檔案管理來說,大數據技術的實用性是非常顯著的,因此作為檔案的管理者必須掌握這一技術,否則將落后于時代的發展,將陷入管理工作的被動。
  1.預測分析。預測分析,即對未來的分析,一般觀點認為未來是不可預測的,但事實上未來是可以預測的,只是無法以人力預測。簡單來說,未來是由現在構成的,按蝴蝶效應理論,任何一個微小的變量都會引發巨大的變化,或者說產生一種未來,也就是說變量有多少,未來就有多少,因此只要統計出所有變量,也就能夠計算出所有的未來。但以傳統技術,這是根本無法做到的,因此人們才會覺得未來是不可預測的。利用大數據技術則能夠有效地解決這一問題,大數據技術不僅能夠分析結構化的數據,也可以分析非結構化的數據,非結構化的數據是傳統技術所無法處理的,也就是上述的海量變量。具體到高校檔案,利用大數據的預測功能,學??梢栽谥T多方面開展預測,從而為決策奠定基礎,例如設定最優化的錄取分數線、優化專業設置等。
  2.分布式存儲。分布式存儲是大數據的基礎管理模式,此種管理模式的最大優勢集中體現在兩方面:一是降低了管理成本。簡單來說,學校不需要購置大量的存儲設備,利用現有硬件設備,搭載數據管理軟件,就可以完成大數據分析的硬件部署。二是增加了數據的安全性。采用分布式部署,信息是分散的,即便遇到病毒或網絡攻擊,也能夠有效地避免數據損壞或集體泄露。
  3.數據可視化。傳統分析技術,往往以數字說明問題,于非專業人員而言,數字的意義往往是不明確的,而大數據分析提供可視化的分析結果,任何人都能夠以一目了然,理解分析的結果。不僅如此,大數據分析的可視化是自動生成的,免去了開發者后期處理數據的時間成本,因此于開發者和使用者來說,都是極為便利的。
  4.數據挖掘算法。算法,在大數據中,是最核心的技術,也是最復雜的技術。算法,簡單來說,是一種公式。目前,已經產生的算法大約有數千種,其中最著名的有遺傳算法、貝葉斯算法、迭代算法。嚴格來說,任何一種算法都有其局限性,需要根據具體的分析對象加以調整。從某種意義上而言,掌握算法才算是掌握了大數據分析,掌握算法才能夠創新大數據分析。此外,開發者應當注意到算法的性能,即算法的效率問題,不同算法的效率是不同的,而且針對不同的數據,算法的效率也會發生變化,因此開發者必須根據數據采用或開發適合的算法。
  二、高校檔案信息服務現狀
  高校檔案信息服務大體上可分為兩部分,一是校內服務,二是社會服務。長期以來,由于受各種因素的限制,尤其是技術的限制,高校檔案信息服務無論是校內或校外都不太盡如人意。目前,除發達地區的高校,例如清華、北大、復旦、交大及其他一些985、211高校,基本上完成了檔案的數字化,但仍舊有為數不少的高校,尤其是偏遠地區的高校,由于受人力和物力的限制,尚未能完成檔案的數字化,距離大數據分析尚有很多的路要走。此外,即便是已經完成檔案數字化的高校,也存在檔案設置單一、信息不足等問題,歸根結底是未能重視檔案建設,尤其是未能意識到大數據分析于學校決策的重要性。此外,各高校的檔案信息未能整合到一個數據庫中,從而影響了大數據分析的發揮,產生此問題的原因十分復雜,需要在宏觀層面上協調。   三、高校檔案信息服務體系建設
  新中國成立至今,高校所累積的檔案數量可以說是一個天文數字,其中所包含的歷史價值、文化價值、社會價值、經濟價值、學術價值無疑是巨大的。由于受技術條件的限制,長期以來無法有效地利用它們,無疑是一種遺憾,也是一種無奈。如今有了大數據技術,應當盡快地開發它們,讓它們為當前社會的發展提供優質的服務。但任何技術都存在風險,因此建立一個完善的服務體系,是提供優質服務的重要保障,也是可持續發展的重要基礎。具體而言,應當注意以下幾點。
  1.建立數據標準統一的數據庫。目前,各高校的檔案數據都是分散的,且在數字化的過程中采用的是不同的標準、不同的格式。例如,有些高校的檔案是掃描文檔,根本不能作為大數據分析的素材,而大數據分析的基本條件之一就是要有統一的數據標準,只有統一標準的數據才能導入同一個的數據庫,才能得到有效的分析。此外,大數據是海量分析,也就是說數據量越大,分析的準確性越高,因此高校和高校間應當盡快地達成協議,成立統一數據庫,實現數據共享,同時也有利于降低大數據分析的成本。
  2.建立大數據信息收集體制。在傳統技術條件下,檔案信息收集的效率是極低的,而且大量的信息只能被忽略掉。而在大數據技術條件下,高校內產生的一切信息,即使是非結構數據,例如文檔信息、圖像信息、音頻信息、視頻信息、圖表信息、網站流量信息、多媒體信息等都納入檔案管理的范圍中。同時,為了持續有效地管理這些信息,應當盡快建立一個系統性的信息收集制度,具體來說,應當建立一個非結構化的數據庫,這既能提高服務的效率,也能有效地降低管理的成本。此外,鑒于當前是一個非結構化信息大量產生的時代,管理者應當提高這方面的意識,將收集非結構化的信息作為今后工作的重點。
  3.建立云服務信息管理體制。云計算,又被稱為分布式計算,以分布式管理為基礎,能夠在不增加硬件投入的基礎上,完成海量的計算,于高校來說,采用云計算是最適合的大數據分析方案。但云計算存在一定的安全隱患,因為云網絡中的任何一臺計算機理論上可以調取其他任何一個計算機上的信息,因此一旦某一臺計算遭到網絡攻擊,勢必會影響到檔案信息的完整性和安全性。因此,部署云網絡、實施云計算、提供云服務,首先要建立一個嚴格的科學的安全的云管理體系。具體來說,應當成立一個專門的云安全小組,由技術人員對網絡實施有效的監控,一旦發現安全隱患,及時切斷隱患來源與整個系統的聯系。
  4.建立檔案信息服務產品化管理體制。美國前總統奧巴馬曾言,大數據是未來的石油。目前,大數據服務已經產品化、商業化,其經濟價值非常巨大。高校作為大數據中心,如果能夠充分開發自有的檔案資源,將其產品化,不僅能夠為社會發展作出貢獻,且于高校自身的發展極為有利。或許有人會說,高校檔案信息涉及學生隱私,不應當用于商業用途。的確,此類擔心是有必要的,但從根本上來說,此類擔心是不存在的,因為大數據所分析的是抽象的信息,例如行為模式、經濟狀態,因此其結果不會導致隱私的泄露。但高校體制畢竟不同于企業公司,因此有必要設立一個專門的管理體制,以確保信息服務的持續和穩定。此外,應當注意到任何產品都有其生命周期,因此設立一個專門的機構,有利于產品管理,及時調整產品結構,為使用者提供更多的便利。
  四、高校檔案信息服務應用前景
  改革開放以來,我國高校發展進入了空前的階段,相比于新中國之初,目前高校的數量是當時的150倍,我國高校的數量已經位居世界第一,但能夠和世界一流名校競爭的,仍舊是少數。大數據技術,本質上是一種分析技術,是信息化的分析技術,其具有高效和準確的特點,能夠為各行各業的決策提供有效的參考。因此,如果能夠利用好大數據分析技術,高校在發展的道路上必能少走一些彎路,從而趕超發達國家,為國家培養更多的人才。此外,高校和社會是極為緊密的,高校學生最終都將走向社會,為社會提供服務,因此高校檔案在很大程度上是社會檔案的組成部分,也是社會決策的重要依據。因此高校檔案不僅要為學校提供服務,而且要為社會提供服務。
  1.學科建設服務。學校的發展不應當只是規模的發展,而應當是學科的發展。一流的大學必有一流的學科,建設一流的學科離不開科學的決策。大數據分析技術,作為當前最先進的分析技術,必能為學校的發展提供最科學的決策。
  2.為教學創新提供決策。教學創新是學科發展的重要基礎,新的理論、新的技術都能夠推動教學創新,但要從海量的信息中判斷哪一種才是最適合教學創新的理論,無疑需要依靠大數據技術。
  3.就業指導服務。任何一個學生無疑都有這樣的體驗,畢業之際,茫然無措,不知道未來在哪里,也不知道哪一個行業適合自己。利用大數據分析,學??梢詾閷W生提供有效的就業決策。
  4.學術發展。學術水平是衡量一個高校優劣的重要標準。學術創新不是憑空產生的,需要投入大量的人力和物力?;诖髷祿治?,學??梢跃C合評價自身的能力,利用現有的資金投入可能性較大的學術活動。
  5.人才管理。人才管理主要包含兩方面的內容,一是人才引進,二是人才發展。以往,人才引進主要依據的是人才的經歷,但從大數據的角度來看,人才引進不僅要考量人才,也要考量學校自身,簡單來說,不適合學校的人才就不是人才。其次在人才培養方面,利用大數據可以較為準確地得知人才需要什么,能夠為留住人才提供有效的決策。
  總的來說,大數據分析的優勢是非常明顯的,在其幫助下,高校信息檔案的開發利用和信息服務將獲得飛躍的變化,必定能夠為高校的發展及社會的發展作出巨大的貢獻。當然,未來會有更新更好的技術產生,因此作為高校檔案的研究者、管理者應當不斷地學習最新的理論和前沿的技術,如此才能將工作做好,發揮檔案信息的價值。
  參考文獻
  [1]楊碧倩.大數據背景下高校人事檔案管理面臨的挑戰及策略[J].管理觀察,2018(28):126-127.
  [2]石劍文.大數據時代高校數字檔案共享服務研究[J].遵義師范學院學報,2018,20(5):167-169.
  [3]劉丹丹.高校人事檔案信息化管理中的大數據技術運用[J].山西檔案,2018(6):44-46.
  [4]楊柳.大數據時代數據挖掘技術在高校檔案管理中的應用[J].辦公室業務,2018(17):119-120.
  ★作者簡介:蔣碧蓉,海南大學檔案館,經濟師,本科,研究方向為綜合檔案管理。
轉載注明來源:http://www.hailuomaifang.com/1/view-14920316.htm

?
99久久国产综合精麻豆