季節性ARIMA模型對社會消費品零售總額的建模和預報
來源:用戶上傳
作者:
摘 要:近年來,我國消費品市場總量不斷擴大,消費持續發揮著經濟增長第一驅動力的作用。時間序列領域,季節性ARIMA模型是一種較為有效的預報模型。本文對近年的社會消費品零售總額做簡要的分析并通過建立季節性ARIMA模型來預測2019年各月的社會消費品零售總額情況。
關鍵詞:社會消費品零售總額;季節性ARIMA模型;預報
0 引言
2019年春節期間,“車厘子自由”這個話題引起了人們相當高的討論度。網友們把隨心所欲消費高端水果的能力稱之為“車厘子自由”。曾經作為高價水果代表的進口車厘子,今年頻頻出現在了三、四線城市老百姓的餐桌上,成為了消費升級的典型樣本。來自國家統計局的數據顯示,2018年社會消費品零售總額超過38萬億元,市場總量穩步增加,扣除價格因素實際增速達6.9%。社會消費品零售總額指的是國民經濟各行業直接售給居民住戶和社會集團的消費品總額,能反映出居民生活水平、社會零售商品購買力等的情況。本文將對近年的社會消費品零售總額情況做簡要的分析并通過建立季節性ARIMA模型來預測2019年各月的社會消費品零售總額情況。
1 社會消費品零售總額
社會消費品零售總額的定義是企業通過交易直接售給個人、社會集團,非生產、非經營用的實物商品金額,以及提供餐飲服務所取得的收入金額。社會消費品零售總額既包括售給個人用的生活消費品和修建房屋用的建筑材料,也包含售給社會集團用作非生產、非經營的商品,不包括企業用于生產經營、固定資產投資所使用的原材料、燃料和其他消耗品,也不包括城市居民用于購買商品房的支出和農民用于購買農業生產資料的支出。[1]
近年來,網上零售業發展迅猛。隨著智能手機的普及以及電商在三四線城市的下沉式發展,網絡零售市場持續擴大。社會消費品零售總額包括實物網上零售額,但不含非實物商品網上零售額。2015年,實物商品網上零售額占社會消費品零售總額已達到15%,2018年占比18.4%,其零售額同比上年增長25.4%。
隨著消費市場總量的穩步提升,消費對經濟增長的貢獻率不斷提高。目前,社會消費品零售總額是表現國內消費需求最直接的數據。但社會消費品零售總額不能反映除餐飲外的服務性消費的支出情況。而旅游、文化、信息等服務消費這幾年較快增長,國內整個消費形態由實物向服務型消費轉變。在這樣的形勢下,社會消費品零售總額對全社會消費趨勢變化的貢獻正在減弱。
2 季節性ARIMA模型對社會消費品零售總額的預測
2.1 模型的理論知識
在時間序列分析領域,Box-Jenkins提出的ARMA模型、ARIMA模型以及季節性ARIMA模型提供了比較有效的手段來對實際問題做建模和預報。雖然它們可能不是最優的,但它們的適應面和手段比較廣,容易掌握,且預報結果也有一定準確性[2]。
2.2 建模
此次分析的數據來自國家統計局官網,2000~2018年各月的社會消費品零售總額的當期值。由于各年1~2月的當期值未被公布,因此我們目前共有19×10=190個樣本數據。使用的軟件是R。作以時間為橫軸,消費量為縱軸的時序圖,呈明顯的上升趨勢??梢钥吹礁髂晟鐣M品零售總額當期值有幾個明顯的變化趨勢。從2015年開始,10、11月的當期值出現了較明顯的提升,而2015年的時候,10月當月零售總額還遠低于12月的數值,相信是受到了國慶假期、“雙11”的影響迎來的消費潮。另外,2012年起社會消費品零售總額呈現3月增長4月回落的模式,4月基本是每年數量最低的月份。
對于各月的零售總額這一時間序列,其自相關系數圖呈現明顯的拖尾性,即非平穩的。為了消除這種趨勢,做一階差分。為消除季節相關,進一步做周期為10的季節差分。從圖2看,序列基本平穩。
用軟件做一下單位根檢驗,看一下是否存在單位根來測試序列的平穩性,經檢驗,在5%顯著性水平下拒絕存在單位根,因此可以說,經過一階差分及季節差分后的時間序列滿足平穩性。
現在我們有d=1,D=1,s=10,接下來需要確定階數p,q,P,Q的值。一般我們可以根據平穩時間序列的自相關和偏自相關圖來確定。對于MA(q)模型來說,其自相關函數是q步截尾的;對于AR(p)模型來說,其偏自相關函數是p步截尾的。從圖2看,可以認為p=2,q=2,從Lag10,20的位置來看,可以認為P=2,Q=2,從而選擇模型ARIMA(2,1,2)×(2,1,2)10??梢园l現,這種確定方法較為主觀,面對同樣的問題,往往可能會有多個模型適用。我們還可以根據信息準則來確定模型。有幾種信息準則可以使用,比如赤池信息準則,即AIC信息準則,AIC的校正版AICc準則,以及貝葉斯信息準則,即BIC信息準則。其統計量如下:
這些準則所遵循的統計思想基本都是選擇最好的解釋數據但包含更少自由參數的模型,即選擇統計量更小的模型。
這里用R軟件中的auto.arima函數來自動確定p,d,q,P,D,Q。auto.arima函數會通過選取最小AIC、AICc、 BIC的值來確定模型,最終選擇的模型是ARIMA(2,1,2)×(2,1,2)10。auto.arima函數默認先用條件最小二乘法求參數的初始值,然后再用極大似然估計法求得參數,最終得到φ1=-0.1844,φ2=-0.2559。
對于季節性ARIMA模型,其殘差必須滿足白噪聲序列,因此還需要對殘差的估計序列進行檢驗,如果不是白噪聲,那么其擬合是有問題的。我們做Ljung-Box檢驗,LB統計量用來檢驗樣本的多個自相關系數是否同時為0,以判斷序列總體的相關性是否存在。做滯后1-10的檢驗,Ljung-Box統計量的p值為0.6,修正后的Ljung-Box統計量的p值為0.4[4],因此沒有證據說明殘差存在著顯著的前后相關性,可以認為其符合白噪聲序列。
2.3 預報
3 總結
通過上面的分析和預報,我們看到各月的社會消費品零售總額當期值存在明顯的季節性波動。一年之中整體呈上升趨勢,近四年來都保持著4月零售總額較低,7月小幅回落,10月迅速增長的模式。數據波動的背后都有復雜的社會因素,有的有規律可循,有的屬于偶然突發。季節性ARIMA模型的預報是基于一定規律下的預測,無法應對外生的隨機干擾。對國民經濟發展趨勢進行分析,除了要善用模型,還要對市場發展、政策形勢有足夠深入的了解。
參考文獻:
[1]國家統計局官網:貿易統計,2018.
[2]謝衷潔. 應用概率統計研究實例選講.北京大學出版社,2011.
[3]Gerda Claeskens. Model Selection and Model Averaging. Cambridge University Press,2008.
[4]Ruey S.Tsay. 金融數據分析導論:基于R語言.機械工業出版社,2013.
轉載注明來源:http://www.hailuomaifang.com/2/view-14875003.htm