您好, 訪客   登錄/注冊

數據挖掘技術在經濟統計調查中的應用研究

來源:用戶上傳      作者:

  摘要:從我國現階段的情況來講,社會經濟處于快速發展的過程中。經濟領域的數據和信息在不斷的生產,通過挖掘這些數據可以幫助我們制定更合理的經濟決策,并為之后的經濟發展創造動力,這已經成為現階段最重要的發展方式。數據挖掘技術可以在大數據中發現具有更高價值的隱藏事件,在人工智能與統計等多項技術的基礎上,制定出更加科學的經濟決策。本文就相關內容展開了綜合性的闡述與分析,首先介紹了數據挖掘技術和現階段我國經濟統計調查數據的基本情況,之后分析了數據挖掘技術在經濟統計調查中的應用。希望通過本文對相關內容的闡述與分析,能夠進一步提升相關研究的實際效果,為我國的發展創造出更大的動力。
  關鍵詞:數據挖掘技術;經濟統計調查;應用
  中圖分類號:TP311.13
  文獻識別碼:A
  文章編號:1001-828X(2019)010-0132-01
  前言
  由于經濟調查數據自身的復雜性和統計調查過程中的復雜性,導致分析人員在對經濟統計調查數據進行使用時,不能準確的提取自己需要的數據信息,從而降低了經濟統計工作的效率和準確度。而數據挖掘技術的最大優勢就是從大量的數據中發現有用的信息并利用多種算法和分析軟件對數據進行分析和處理,從而解決我們的實際問題。數據挖掘和經濟統計調查工作的結合定然能盡可能的挖掘出有效信息從而使調查數據得到最有效的利用,并且機器學習在統計調查數據中的應用能使數據得到最優處理,提高工作效率。
  一、數據挖掘技術和統計調查工作的基本情況
  數據挖掘技術簡單來說就是對數據信息進行更深入的挖掘。這一技術主要是將原來比較復雜,并且有非常多變化種類的數據庫簡化,并通過對簡化的數據信息進行分析,找出其中可以被利用的數據,通過不斷的分析與整理工作,使信息使用效果進一步提升[1]。我國現階段經濟統計調查數據非常豐富且很多數據并不是非常的完整,導致使用一些普通的手段進行數據統計并不能獲得較好的效果。數據挖掘技術能夠有效地解決這一問題,通過軟件與程序算法,對原來并不是非常完整的數據進行綜合性的分析,最終制定出更加合理的統計數據形態,使有關使用者可以更直接的對數據進行提取與使用。在這一過程中,一般分為三個步驟。首先是準備相應的數據,其次是進行數據挖掘工作,最后對所獲得的結果進行分析。
  二、數據挖掘技術在經濟統計中的應用
  1.經濟統計調查數據的預處理
  經濟數據的預處理是經濟數據統計活動之中非常常見的一項處理方法。需要對數據進行預處理的主要原因是因為挖掘技術自身會受到多種經濟條件的限制,不能完全取代經濟系統所擁有的收集作用,其僅僅是對基礎信息進行智能化分析以及在統計調查工作中得到數據的復雜性。處理的內容涉及到了非常多的種類,例如處理不準確的數據,或者是處理錯誤的數據和處理差距很大的數據信息。這些實質上稱之為“數據清洗”,數據清洗的方法有插值法,均值法等,對于明顯異常且數量不多的數據可以甚至選擇直接刪除。
  2.數據挖掘技術在調查數據分析中的應用
  數據挖掘技術在經濟統計調查中的應用可以大致的分為兩個方向,分別為描述方向和預測方向。描述方向主要包括聚類和描述變量或數據間相關關系的各種算法。聚類是將相關關系較大的變量或個體聚為一類,即R型聚類和Q型聚類,其實質也起到了降維的作用。而描述變量或數據間相關關系的方法有典型相關分析——通過研究典型相關系數來揭示兩組變量間的相關關系;對應分析——研究兩組分類變量或分類變量內部各個狀態之間的相關關系。預測方向主要包括分類和回歸,分類的主要工作是“貼標簽”,具體算法有決策樹、人工神經網絡、遺傳算法、SVM、樸素貝葉斯模型等。[2]回歸不同于分類的是分類是對離散型數據做預測而回歸是對連續型數據做預測,回歸模型包括線性回歸、多項式回歸、Lasso回歸、嶺回歸等。
  聚類在經濟統計調查中最為常見,為了提高調查精度,在抽樣調查中可以先將調查對象聚類,再從不同類中分別抽取樣本,抽樣調查中的分層抽樣和整群抽樣都可能用到聚類方法。如在對居民的收入情況進行抽樣調查時就可以先根據居民的消費數據對其聚類分析,一類即為一層,進而對居民進行分層抽樣,從而提高調查精度。降維方法也廣泛的應用于經濟統計調查中,由于統計調查進行一次需要花費大量的人力和物力,所以在統計調查中指標一般較多且詳細復雜,這就需要數據挖掘中的降維技術將相關性大的變量合并在一起,從而使數據分析更為簡便清晰,主要的降維方法有主成分法、因子分析法等?,F階段降維算法與評價算法相結合已應用于經濟評價中,如對各個城市的綜合競爭力和上市公司的綜合實力進行排序與評價。
  數據挖掘中的分類技術已經成功地應用于銀行信用風險的統計調查中,銀行的信用風險分為高、中、低三個等級,運用SVM和BP神經網絡技術均可以準確的預測出風險所屬類型。且經過實踐表明,SVM在預測精度上略高于BP神經網絡技術。[3]
  三、結語
  就我國當前的發展工作來講,經濟統計調查工作有所提升,且隨著數據挖掘技術不斷應用,統計數據分析工作有了更好的效果,而且還獲得了非常高的質量?,F階段數據挖掘已經達到了比較穩定的狀態,并處在不斷研究的過程之中。但是在實際應用的過程中,仍存在非常多的問題,需要通過更有效的方法對其進行研究,提高其實際效果,使我國的數據挖掘技術能夠獲得更大程度的進步,為我國經濟統計發展創造出更大的動力。
  參考文獻:
  [1]陳韋冰,張巧玲,徐小紅.基于數據挖掘技術構建適宜基層應用的2型糖尿病視網膜病變風險預測模型研究[J].中國實用醫藥,2019,14(2):181-182.
  [2]羅可,林睦綱,郗東妹.數據挖掘中分類算法綜述[J].計算機工程,2005,31(1):3-5.
  [3]沈志偉.基于SVM的商業銀行信用風險預測[J].合作經濟與科技,2012(16):52-53.
轉載注明來源:http://www.hailuomaifang.com/3/view-14854461.htm

?
99久久国产综合精麻豆