R語言在綜合評價方法中的應用
來源:用戶上傳
作者:
摘要:在大數據時代,傳統的統計專業課程也需要順應時代發展的要求。本文論證了使用R語言解決統計綜合評價問題的可行性。首先,概述了統計綜合評價的現狀及發展趨勢,接著從R語言自身的優勢、統計綜合評價課程及相關課程發展的要求三個方面對R語言在統計綜合評價教學中的應用進行了論證,最后提出了統計綜合評價課程改革的建議。
關鍵詞:R語言;統計綜合評價方法;可行性
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2019)22-0247-02
一、綜合評價方法的現狀及發展趨勢
統計綜合評價也可被稱為“多指標綜合評價”,就是針對一個復雜的評價主題和一個由多單位組成的評價對象,從不同角度設定指標對各個單位進行測量,然后將測量結果按照某種方法綜合起來得到一個可以用來比較各單位高低優劣的綜合數值[1]。綜合評價是一個評價的流程及體系,一般包括了對象的選擇、指標的選取、權重系數的設置、模型的擬合、計算得分后排序等環節,它被廣泛應用于社會科學和自然科學等各個領域,一直是進行比較排序的有效方法,理論與應用都有廣泛的發展前景。
統計綜合評價理論的發展可以追溯到20世紀50年代統計決策理論的發展,與多屬性決策有著千絲萬縷的聯系,雖然兩者在研究對象、目標實現、方案集的篩選上有差別,比如評價面對過去發生的對象,決策面向未來尚未發生的對象;評價以排序為目的,決策以擇優為目的;評價對被評價對象不做刪減,決策對備選方案集進行刪減[2]。但是兩者在方法上幾乎沒有差別,甚至可以說綜合評價的方法就是多屬性決策的方法[3]。迄今,多屬性決策領域以取得了豐收的成果,也為綜合評價的發展增添了更多的決策方法[4]。
1998—2017年這19年間,國家社科基金立項的項目中有關于綜合評價的立項項目有49項,其中綜合評價應用項目42項,關于理論研究項目共7項。從社科基金的立項結果來看,綜合評價理論發展的方向是不完全信息、動態評價、面板數據評價、綜合評價方法優良的判斷標準和對綜合評價質量的評價。姚爽從證據理論和有序加權算子的角度,針對不完全信息集的綜合評價情況提出了可行的方法,樣本量從以傳統的參數統計中的大樣本為基礎,逐步轉向非參數統計的小樣本、屬性數據及高維數據的評價[3]。孫利榮從權重系數的函數性質出發,研究了綜合評價中權數的設置問題[5]。張明倩從評價質量角度解決了多種評價方法得出不同的評價結論,而評價結論無法比較優劣的問題,從綜合評價構建框架質量的定性評估、綜合評價方價基礎指標及其構成結構的質量評估、綜合評價構建技術的質量評估、綜合評價結果有效性的質量評估四個方面對評價結論的穩定性進行了說明。徐明明、張立軍等從鑒別能力、相關性、有效性與可靠性等方面構建了相應的測度指標,通過實例測度和比較了各種評價指標體系的優良性。曾守楨、張崇輝認為綜合評價的發展方向主要集中在兩個方面:一是尋找合理的方法提高主觀評價的準確性,二是將綜合評價理論與數據挖掘理論相結合。
在教學方面,《統計綜合評價》課程在許多高校中作為一門統計專業的專業選修課,要求學生掌握評價的各個基本環節、基本的評價方法以及能夠采用恰當方法對復雜對象進行評價。統計綜合評價方法在教學方面有兩種情況:一種偏于理論,從數理的角度對方法實現的各個環節進行定義、證明,理論性、系統性更強,但是在教學時會比較晦澀難懂,相應分配在應用上的課時較少,如郭亞軍的《綜合評價理論、方法及應用》[2],張發明的《綜合評價基礎方法與應用》;另一種偏向于應用,在介紹了Matlab軟件的基礎上系統介紹了多種綜合評價方法的建模程序,又用案例進行了演練,具有良好的實用性。
二、R語言適合統計綜合評價方法的論證
(一)R的優勢
1.統計軟件的比較。從《統計綜合評價》課程使用統計專業常用的軟件,SPSS可以處理多元統計分析方法的評價結果,但是在多屬性決策、運籌方法、模糊數學和智能評價方面無法達到;SAS可以自己寫代碼,但是更新升級慢、編寫自定義函數和詳細的宏代碼需要深厚的編程知識來確保正確性;Matlab是一種通用的科學計算軟件,并不限于某一特定的專業領域,它的源代碼開放可以自由擴充,非常適合于評價方法的編程,但當遇到基于矩陣的運算,當有奇異陣時,程序無法繼續運行。R語言易于上手,使用者一旦掌握,不但能實現常見的數據分析目標,而且能自行對現有的模型、算法分析擴充,從而充分滿足不同個性化分析的需要。
2.R語言的效率極高。大數據時代的數據具有價值密度低、處理速度快的特點,綜合評價對數據處理的要求是降維和特征提取,在數據降維方面,R語言中的數據框和列表可以存儲多種數據類型,并有相應的算法和處理方式,而且直接使用R的豐富的擴展包以節省精力。在特征提取方面,越來越多的數據挖掘程序直接執行的是R語言,R中的HELP函數直接介紹R中各種函數和包的使用方法,并且綜合評價時使用R會提高獲取數據的速度,因為R有多種面向關系型數據庫管理系統(DBMS)的接口,使用R來訪問存儲在外部數據庫中的數據是一種分析大數據集的有效手段,能發揮SQL和R各自的優勢,提高數據獲取的效率。
?。ǘ┚C合評價課程內容上的論證
綜合評價包括了幾個基本評價環節:數據的預處理、評價對象的選取、評價指標體系的設立、權重系數的確定、模型擬合、得分排序,還有學者從質量的角度對各環節進行控制。不論從哪個環節來說,應用R語言實現都是非常合適的。
評價者可以將自己的評價思路和所要達到的客觀結果通過編程語言實現。數據在預處理時,R語言具有高效的數據處理和保存機制、完整的數組和矩陣操作運算符,能夠綜合評價各環節的參與程度;在指標體系構建時,R語言數據框里包含了眾多的數據結構,有向量、矩陣、數組、數據框、列表,可以存儲屬性數據和數量指標,可以使用因子、數據框或者列表的形式保留被評價對象的所有數據,信息量損失少;權重系數的設置,可以使用R中的函數或編寫代碼計算權重系數;評價方法的選擇環節,R包含的包很多,只要簡單的加載在現有的程序上即可使用。評價者能夠使用多種方法對被評價對象進行評價,設置優良標準,比較各種方法的優劣,不僅大大擴寬了評價思路,還節約了大量因為編寫程序所用的時間,提高了評價效率和準確性。
?。ㄈ┫嚓P課程的論證
在專業課程設置上,基本上開設統計學專業的高校都開設了R語言課程作為專業必修課或選修課,編程的掌握已成為統計專業學生的基本能力。同時,并行課程《統計模型與統計實驗》、《數據挖掘》等都可以使用到R語言作為實現或對接的實現手段,專業間的關聯性也迫使相關專業進行課程改革,將數據挖掘理論與綜合評價理論相結合,R可以作為一個非常好的橋梁,是既兼顧了教學又兼顧了應用的好途徑。而其中模糊綜合評價方法、灰色關聯分析法和層次分析方法早已在用R語言實現。鑒于有開設《R語言》的基礎課程,使用R語言對大部分學生來說駕輕就熟,在《統計綜合評價》學習的過程中如果鼓勵學生使用R語言解決各種評價問題,既是R語言編程技能的進一步提升,也是綜合評價方法的良好實踐,激發學生的學習動力,未來也許會有更多實用的程序包出現,為評價的發展提供了更多的支持。
三、結論
隨著大數據時代的來臨,數據海量、多樣性的特點不但給傳統的與數據打交道的統計學專業增加了新的專業發展方向,也向傳統專業課程吹響了革新的號角。綜合評價理論的發展方向是不完全信息、函數型權重、質量評價、標準的設置,在教學過程中可以將綜合評價中的傳統方法用R語言實現,使其使用更加便捷,應用范圍更加廣泛。
參考文獻:
[1]高雪敏.風行的綜合評價[J].中國統計,2008,(5).
[2]郭亞軍.綜合評價理論、方法及應用[M].北京:科學出版社,2007.
[3]姚爽.不完全信息綜合評價方法與應用——基于證據理論和有序加權算子的研究[M].北京:經濟科學出版社,2015.
[4]孫利榮.綜合評價中權數的函數性質及其生成研究[J].數學的實踐與認識,2014,44(8):54-62.
[5]張明倩.多指標綜合評價質量的評估方法與實踐[M].上海人民出版社,2017.
轉載注明來源:http://www.hailuomaifang.com/9/view-14825908.htm