基于R語言的城市PM2.5影響因素分析
來源:用戶上傳
作者:
摘 要:以R語言為數據分析的工具,基于相關分析和回歸分析方法,對太原市PM2.5的影響因素進行分析。研究PM2.5與其他氣態污染物之間的關系,探討各氣態污染物在PM2.5二次合成中的貢獻;建立PM2.5和PM10的回歸模型,方便通過PM10對PM2.5進行預測。結果顯示:(1)太原市區空氣污染物中,PM2.5和PM10相關性最強;(2)PM2.5和PM10回歸分析得到回歸模型為PM2.5=0.63PM10-11.76(R2=0.8427),回歸方程擬合度較好;(3)PM2.5和其他氣態污染物多元線性回歸模型為PM2.5=0.24SO2+20.08CO+11.54(R2=0.4844),擬合度檢驗效果一般,考慮三者之間還有其他因素的影響。
關鍵詞:R語言;數據分析;相關分析;回歸分析
中圖分類號:TP315.69 文獻標識碼:A
Abstract:Using R language as a tool for data analysis,based on correlation analysis and multiple linear regression analysis methods,the paper analyzes the influencing factors of PM2.5 in Taiyuan City,studies the relationship between PM2.5 and other gaseous pollutants,and explores the contribution of gaseous pollutants in secondary synthesis.The regression model of PM2.5 and PM10 is established to facilitate the prediction of PM2.5 through PM10.The results show:the correlation between PM2.5 and PM10 is the strongest among the air pollutants in Taiyuan;the regression model achieved through the regression analysis on PM2.5 and PM10 is PM2.5=0.63PM10—11.76(R2=0.8427),with high fitting degree;the PM2.5 and other gaseous pollutants multivariate linear regression model is PM2.5=0.24SO2+20.08CO+11.54(R2=0.4844).The test results are general,considering the influence of other factors.
Keywords:R language;data analysis;correlation analysis;regression analysis
1 引言(Introduction)
PM2.5是指大氣中直徑小于或等于2.5微米的顆粒物,也稱為可入肺顆粒物。它的直徑還不到人的頭發絲粗細的1/20。雖然PM2.5只是地球大氣成分中含量很少的組成,但它對空氣質量和能見度等有著重要的影響。與較粗的大氣顆粒物相比,PM2.5由于粒徑小,富含大量有毒、有害物質,且在大氣中停留時間長、輸送距離遠,因而對人體健康和大氣環境質量影響更大,是導致心腦系統和呼吸系統的損傷,增加患癌癥的風險,以及霧霾產生的主要因素[1-3]。
本研究通過python編寫接口程序,獲取太原市九處國控監測點,2014年3月至2018年2月的PM2.5及其他污染指標數據。通過對近四年的數據進行統計分析,探討太原市PM2.5形成的影響因素。此研究將為太原市相關管理部門和人員,對城市規劃建設、城市環境治理和生態文明建設工作提供合理有效的科學參考。
2 R語言簡介(Introduction to R language)
R是一種用于統計分析計算及圖形化展示的開源軟件,同時也是一種編程語言,它廣泛應用于農業、林業、商業、工業、政府部門、醫藥和科研等眾多涉及數據分析的領域,隨著近幾年數據挖掘、大數據等概念不斷發展,R作為數據分析的利器也越來越多地被人關注[4-6]。
3 方法及原理(Methods and principles)
為了研究PM2.5和其他大氣污染物和氣象條件之間的關系,根據變量類型,在本研究中主要用到了二元定距變量的相關分析。二元定距變量的相關分析通過計算定距變量間兩兩相關的相關系數,對定距變量兩兩相關程度進行分析[7]。
4 分析過程(Analysis process)
4.1 PM2.5與其他污染物的關系
為了了解PM2.5和其他各污染物之間的關系,采用Pearson相關系數檢驗,從表1可以看出,PM2.5和PM10,PM2.5和SO2,PM2.5和CO之間有較強的線性相關性,相關系數分別為0.92、0.66、0.66,相伴概率P值均小于0.05,說明兩兩之間相關性很顯著。PM2.5和PM10線性相關性最強,說明二者具有相似的污染源。除臭氧之外PM2.5和其他污染物的相關系數介于0.56至0.92,說明臭氧污染對PM2.5影響不大,太原市的PM2.5污染除一次排放之外,氣態污染物的二次化學合成也占一定比重。 4.2 PM2.5與PM10的回歸分析
我國對PM10的監測研究起步較早,由于空氣質量的惡化和霧霾事件的頻發,對PM2.5的關注是從近幾年才開始,對PM2.5的監測區域和監測點數都有所限制,所以研究PM2.5和PM10之間的關系,探索分析二者之間的回歸模型,對于PM2.5的預測和研究有重要的意義。
4.3 PM2.5與其他氣態污染物的關系
PM2.5的來源比較復雜,除了土壤揚塵、植物花粉等自然源外,太原市的PM2.5污染只要是人為源,從之前的區域監測點數據對比,以及太原市空氣污染物主成分分析可以看出,太原市的PM2.5污染源主要是以工業源和交通源。按照形成方式來看,PM2.5又分為一次排放和二次合成,由于工業過程和燃燒排放的氣態前體污染物通過大氣化學反應生成二次顆粒物。
通過相關性檢驗發現PM2.5和SO2、CO兩種氣態污染物之間關系最大,說明SO2和CO在PM2.5的二次合成中貢獻較大,根據兩年的樣本數據,對PM2.5和CO、SO2進行多元回歸,得出回歸方程。
5 實例分析代碼(Analysis code)
6 結論(Conclusion)
太原市區空氣污染物中,PM2.5和PM10相關性最強,另外PM2.5和SO2、CO兩氣態污染物之間也有較強的相關性,
說明太原市PM2.5污染除一次排放之外,氣態污染物的二次合成也占一定的比重。PM2.5和PM10回歸分析得到回歸模型為PM2.5=0.63PM10-11.76(R2=0.8427),回歸方程擬合度較好;PM2.5和其他氣態污染物多元線性回歸模型為PM2.5=0.24SO2+20.08CO+11.54(R2=0.4844),擬合度檢驗效果一般,考慮三者之間還有其他因素的影響,PM2.5的形成除了氣態污染物的二次合成,主要還有區域污染物的一次排放。
參考文獻(References)
[1] Jihua Tan,Leiming Zhang,Xueming Zhou,et al.Chemical characteristics and source apportionment of PM2.5 in Lanzhou,China[J].Science of the Total Environment,2017,601-602:1743-1752.
[2] Ryou H G,B J H,Kim S.Source apportionment of PM10 and PM2.5 air pollution,and possible impacts of study characteristics in South Korea[J].Environmental Pollution,2018,240:963-972.
[3] Li R,Hardy R,Zhang W,et al.Chemical Characterization and Source Apportionment of PM2.5 in a Nonattainment Rocky Mountain Valley[J].Journal of Environmental Quality,2018,47:238-245.
[4] 李子伊.基于Excel和R語言的成績統計分析——以福建省某中學期中、期末英語考試成績為例[J].英語教師,2017,17(24):44-51.
[5] 周蕓韜.基于R語言的大數據處理平臺的設計與實現[J].現代電子技術,2017,40(02):53-56.
[6] 武茗馨.基于R語言的金融大數據審計應用研究[D].南京審計大學,2017.
[7] 李雄英.基于R語言的統計教學應用初探[J].高教學刊,2017(01):50-51.
[8] 董健衛,陳艷美,孟盼,等.回歸分析與基于MIV的RBF神經網絡在PM2.5的相關因素分析中的應用[J].數學的實踐與認識,2017,47(10):127-136.
[9] 張紅,董小剛,李群.PM2.5濃度影響因素的主成分回歸分析[J].長春工業大學學報,2017,38(02):105-110.
[10] 杜續,馮景瑜,呂少卿,等.基于隨機森林回歸分析的PM2.5濃度預測模型[J].電信科學,2017,33(07):66-75.
轉載注明來源:http://www.hailuomaifang.com/1/view-14892943.htm