您好, 訪客   登錄/注冊

主成分分析在房地產數據中的應用

來源:用戶上傳      作者:

  【摘要】本文利用2006年滬深股市24家房地產上市公司的年報數據,利用SAS軟件來展現主成分分析在房地產數據中的應用,并得出結論,認為用主成分分析在預處理數據上發揮了重要作用,使得主成分分析與其他統計方法更好地結合應用。
  【關鍵詞】主成分分析;房地產;SAS
  1引言
  21世紀以來,國內的房地產行業日漸火爆,房價上漲迅速,房地產業正在逐步成為很多地區經濟發展的強支柱,不僅拉動著經濟的增長,也在改善人民的居住水平。但是在發展的過程中,房地產市場的泡沫不斷增大,房價的虛高也增加了百姓住房的困難,使得過多資本流人到房地產業。針對這些情況,政府也實事求是地出臺了各種政策,從2005年的“新國八條”到2017年的宏觀調控政策,大力發展“互聯網+”模式等都是為了減小百姓在住房問題上的壓力。
  2主成分分析基本思想
  當我們在研究某個課題或項目時,為了更準確、更全面地反映所研究對象的特點及其發展規律時,我們第一反應就是尋找與其有關的因素,這樣會產生兩個問題:一是由于害怕丟失原始數據的重要信息,會自然地考慮很多指標,這就增加了研究過程的復雜度:二是選取的指標之間會出現多重共線性問題,就會抹殺所研究對象的內部真實特點和規律。針對上述問題,我們就會希望在定量研究中能有個兩全其美的辦法,既可以減少涉及的變量個數,又不會遺漏重要的信息。而主成分分析恰是研究如何通過對具有一定相關性的多個變量進行線性組合得到幾個不相關的綜合指標,且能解釋原始數據的絕大部分信息。
  變量問存在一定的相關性,通過對原始變量的相關矩陣或者協方差陣內部關系的研究,利用線性變換,將相關的原始變量轉變為不相關的新的綜合變量,這既保留了絕大部分的原始信息,也起到降維和簡化問題的作用。
  要想從研究對象錯綜復雜的關系中得到一些主干特點,主成分分析就恰好發揮了作用,通過這種多元統計方法,可以有效利用海量數據進行定量分析,揭示研究對象的內部信息,進一步挖掘其內在發展規律,從而能對癥下藥,找出實事求是的解決辦法。
  3實證分析
  3.1樣本選取與數據來源
  本文采用2006年滬深股市24家房地產上市公司的年報數據,利用SAS軟件研究我國房地產上市公司盈利能力與資本結構之間的關系。我們將銷售凈利率x1.資產凈利率x2.凈資產收益率x3及銷售毛利率x4納為反映上市公司盈利能力的指標,用資產負債率v來反映公司資本結構。
  3.2實證結果分析
  3.2.1相關性分析
  先用Excel對這五個變量做一個折線圖,了解各房地產上市公司資產負債率與銷售凈利率等其他變量的關系,發現各房地產上市公司資產負債率與銷售凈利率等其他變量的關系并不完全相關。
  根據上市公司盈利能力四項指標之間的相關系數矩陣結果,除了銷售毛利率與資產凈利率之間的相關系數相對較低,約為0.17.其他指標之間的相關系數都相對比較高:銷售毛利率與銷售凈利率相關系數約為0.45.凈資產收益率與銷售凈利率的相關系數將近為0.67.資產凈利率與銷售的凈利率相關系數約達到0.8.資產凈利率與凈資產的收益率之間的相關系數甚至高達0.9。這說明四個指標之間存在顯著相關性,指標之間具有多重共線性,所以采用主成分分析法對四個指標進行降維。
  3.2.2主成分分析
  根據相關系數矩陣計算出的所有特征值、相鄰兩個特征值之間的差值、每個特征值對應的方差貢獻率以及累積貢獻率。特征值越大那就說明它所對應的主成分變量包含信息就越多。第一個至第四個主成分貢獻率分別約為67.12%、25.20%、6.09%、1.59%,前兩個主成分就包含了原來四個指標92.32%的信息,所以表明可以提取前兩個主成分。
  然后根據全部特征值對應的特征向量,就得到各主成分的數理關系式,即:
  各標準化指標前面的系數絕對值越大,說明該主成分受該指標的影響就越大。前三個標準化指標對第一主成分大小的影響差不多,都在0.55上下波動:決定第二主成分z,大小主要為銷售毛利率,其系數高達0.9:影響第三主成分大小主要為銷售凈利率和凈資產收益率,系數分別約為-0.75、0.55.二者對第三主成分大小的作用相反:決定第四主成分大小主要為資產凈利率和凈資產收益率,系數分別約為-0.78、0.54.二者對第四主成分大小的作用也相反。
  由此得出:第一個主成分與前三個指標關系都比較大,說明它主要涵蓋前三個指標的信息,第一個主成分可以稱之為“公司資產的獲利能力”;而第二個主成分主要涵蓋了第四個指標的信息,可以稱之為“公司的經營能力”。
  3.2.3綜合評價
  由于主成分z1和z2從不同角度反映了這24家上市公司的盈利能力,所以可以考慮按z1和z2的加權平均值進行排序,然后了解哪一家上市公司的盈利能力最好。根據結果顯示:中糧地產的三項指標均名列第一,而高新發展綜合排名倒數第一。
  4總結
  在研究房地產信息時會有大量的數據,這些數據并不都是有用的,如果在研究某些自變量對某一個因變量影響程度時,把自變量都納入研究范疇,就會出現大量信息重疊情況,無法準確反映原始數據的重要信息。用較少數量的特征對樣本指標進行降維就特別重要。所以在分析數據時,主成分分析占有重要的地位。
轉載注明來源:http://www.hailuomaifang.com/2/view-14822760.htm

?
99久久国产综合精麻豆