版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
PM2.5反演模型構建案例分析目錄TOC\o"1-3"\h\u13954PM2.5反演模型構建案例分析 1219731.1建模數(shù)據(jù)描述性統(tǒng)計分析 1124711.2基于空間分區(qū)的反演模型構建 3252681.3各反演模型精度對比 5為了將各類要素應用到后續(xù)反演研究中,需按照分區(qū)結果將反演要素進行多源數(shù)據(jù)匹配。使用的要素均為2017~2019三年的日均值數(shù)據(jù),時間上按照數(shù)據(jù)的日期進行匹配,空間上首先將各類數(shù)據(jù)處理為與Himawari-8AOD一致的空間分辨率,再根據(jù)PM2.5空氣質量國控點的經(jīng)緯度位置,對9個反演要素和地面PM2.5真值進行匹配,剔除無效值后,最終共獲得2017年1月1日~2019年12月31日有效數(shù)據(jù)21811條,其中豫、鄂、湘三個省分區(qū)各8067、5733及8011條??臻g分區(qū)后的時空匹配統(tǒng)計結果見表3-5,至此完成多源數(shù)據(jù)集的構建。表1.1空間分區(qū)后時空匹配數(shù)據(jù)統(tǒng)計分區(qū)總計豫8067鄂5733湘8011總計218111.1建模數(shù)據(jù)描述性統(tǒng)計分析描述性統(tǒng)計分析,是復雜統(tǒng)計分析的基礎,用來探究數(shù)據(jù)分布的趨勢,判斷是否存在極端異常值。根據(jù)第3章中多源要素時空匹配后,共獲得有效數(shù)據(jù)有效數(shù)據(jù)21811條,其中豫、鄂、湘三個省分區(qū)各8067、5733及8011條。使用SPSS軟件分析不同空間分區(qū)下各要素的描述性統(tǒng)計特征,結果如表1.1所示:表1.2不同空間分區(qū)下PM2.5與各反演要素的統(tǒng)計特征分析區(qū)域AODUWSVWSRHTBLHHVCLVCPPM2.5湘最小值0.010.000.000.39-3.8610.460.000.0291.061.00最大值2.991.045.910.9932.391108.310.970.97103.53303.13均值0.390.761.380.8015.95158.200.210.7899.9346.45標準差0.400.581.100.109.55159.200.180.171.8023.43鄂最小值0.010.000.000.33-12.4110.350.000.0089.553.00最大值2.941.657.060.9932.81956.700.990.99103.66231.00均值0.411.141.440.7915.23162.720.050.92100.4746.40標準差0.290.851.100.1010.28137.020.100.111.9622.77豫最小值0.010.000.000.19-8.8010.510.000.0192.393.00最大值2.806.587.320.9932.931608.290.991.00103.46283.92均值0.481.421.470.6413.06198.720.030.9799.9051.67標準差0.361.141.200.1811.31178.060.070.081.9227.78根據(jù)上表的統(tǒng)計特征分析結果,2017年1月1日~2019年12月31日間,湖南分區(qū)PM2.5的濃度變化在4~303μgm-3之間,均值為46.45μgm-3;湖北分區(qū)PM2.5的濃度變化在3~231μgm-3之間,均值為46.4μgm-3;第三分區(qū)PM2.5的濃度變化在3~284μgm-3之間,均值為51.37μgm-3。PM2.5濃度的極大值出現(xiàn)在湖南分區(qū),即為華中地區(qū)的南部;均值最高出現(xiàn)在河南分區(qū),即為華中地區(qū)的北部,AOD濃度的均值最高亦出現(xiàn)在河南分區(qū),為0.48,與PM2.5濃度保持一致。觀察發(fā)現(xiàn),這九種數(shù)據(jù)的標準差均小于均值或與均值相差不大,說明數(shù)據(jù)離散程度不高,可用于下一步的反演建模。PM2.5污染物的集聚擴散與氣象、地形因素有著密切的聯(lián)系,因此在反演模型構建前使用SPSS軟件分析不同空間分區(qū)下各反演要素與PM2.5的Pearson相關系數(shù),從變量之間的相關性程度,來探尋與PM2.5密切相關的要素,結果如表1.2所示:表1.3不同空間分區(qū)下PM2.5與各反演要素間Pearson相關系數(shù)區(qū)域AODUWSVWSRHTBLHHVCLVCP湘0.268-0.07-0.0120.141-0.458-0.17-0.043-0.0410.30鄂0.309-0.08-0.0370.188-0.576-0.301-0.063-0.0610.244豫0.314-0.036-0.0350.185-0.383-0.195-0.083-0.0890.191由上表結果分析得出,不同要素對PM2.5濃度的影響情況存在較大差異,有的反演要素為顯著相關,有的反演要素相關性較弱。其中實測PM2.5與氣溶膠光學厚度AOD、溫度T和氣壓P的相關性最高:PM2.5與AOD有較強的正相關性,相關系數(shù)均在0.25以上,其中河南分區(qū)最高達到0.314,因為AOD為表征大氣渾濁程度的物理量,其值越高表明大氣污染越強,相應的PM2.5濃度越高;PM2.5與溫度T有較強的負相關性,相關系數(shù)均為-0.3以上,其中湖北分區(qū)最高達到-0.576,因為與夏季相比,冬季溫度低,空氣中的細顆粒物的布朗運動會減弱,導致這些污染物無法快速參與大氣循環(huán),而且冬季用電量增大,采暖燃煤和機動車尾氣排放增多直接導致污染加??;PM2.5與地面氣壓P有明顯的正相關性,地面氣壓越高越不利于PM2.5的擴散。其他因子與實測PM2.5的相關性較前面三個稍差,與PM2.5呈正相關的氣象因子是相對濕度RH,相關系數(shù)均在0.1~0.2之間,說明存在一定的促進作用但不明顯,空氣中濕度越大越容易吸附懸浮于空氣中的PM2.5顆粒,從而提高PM2.5的質量濃度;邊界層高度與實測PM2.5表現(xiàn)出負相關的關系,處于0.1~0.3之間,當邊界層高度較低時,污染物(從地球表面排放)的濃度就會增加,這是由邊界層高度的特性決定的,和PM2.5是此消彼長的關系。剩余的四個因子相關系數(shù)均低于0.1,說明PM2.5的變化受它們的影響較?。篜M2.5與水平風速UWS和垂直風速VWS呈負相關關系;PM2.5與HVC/LVC正相關。綜上所述,各要素與PM2.5的關系可能會受分區(qū)影響,因此分區(qū)構建反演模型時需要考慮同時構建分區(qū)和全域模型作為對比,探討對模型效果的影響。1.2基于空間分區(qū)的反演模型構建不同空間分區(qū)的反演數(shù)據(jù)集80%用于模型訓練,20%用于結果測試。為消除數(shù)據(jù)時間上的連續(xù)性帶來的偏差,隨機抽樣選取訓練數(shù)據(jù)和驗證數(shù)據(jù)。(1)多元線性回歸模型多元線性回歸模型的構建,主要通過SPSS中的步入法,在迭代中逐步加入?yún)?shù)并舍棄掉多余的參數(shù)進行回歸,下式即為研究區(qū)構建的多元線性回歸方程:(1.1)其中b0為常數(shù),b1,…,為偏回歸系數(shù),是隨機變量。從模型擬合結果可以看出三個分區(qū)的R2都小于0.5,平均絕對誤差和均方根誤差都比較大,說明此模型擬合效果一般。表1.3是將不同省份的樣本訓練以后得到的回歸方程,從擬合結果可以看出,傳統(tǒng)線性模型的擬合決定系數(shù)均低于0.5,平均絕對誤差和均方根誤差都在10以上,預測結果與實測值的皮爾森相關系數(shù)均在0.7以下,盡管加入了九種數(shù)據(jù)進行模型擬合,效果仍然不理想。
表1.4各區(qū)域多元線性回歸模型精度分區(qū)多元線性回歸模型R2MAERMSEr湘y=16.137AOD+2.290UWS-0.979VWS+1.466RH-0.928T-0.012BLH+38.554HVC+28.497LVC+1.712P-148.4460.31213.1519.480.559鄂y=26.66AOD+1.164UWS+1.158VWS+7.215RH-1.097T-0.026BLH-21.11HVC-21.546LVC+0.664P+241.6790.45011.9316.890.67豫y=121.169AOD+2.867UWS+1.908VWS+35.823RH-1.274T-0.07BLH+569.055HVC+579.118LVC-2.21P-327.7350.33115.2222.710.576(2)BP神經(jīng)網(wǎng)絡模型根據(jù)(2.2)式可以計算出神經(jīng)元的個數(shù)在3-12之間,根據(jù)之前的經(jīng)驗公式,經(jīng)過多次對比,本次實驗中選擇隱層神經(jīng)元的個數(shù)為4,如下圖所示:圖1.SEQ圖4.\*ARABIC1BP神經(jīng)網(wǎng)絡拓撲圖本次實驗中構建的BPNN模型為多層感知機(MLP),終止規(guī)則使用最低準確性90%或者最大訓練時間15分鐘,生成隨機種子315996064個,選取30%的集合防止過度擬合。BP神經(jīng)網(wǎng)絡可以對非線性輸入輸出關系進行模擬,在分類識別、回歸、壓縮和逼近等領域都有著廣泛應用。其局限性在于BP算法使得訓練過程中容易陷入局部最小值,而并非全局最優(yōu)解,另外還會導致訓練的收斂速度緩慢。(3)隨機森林模型隨機森林算法模型的構建,主要通過SPSSModeler中的RandomTrees模塊實現(xiàn),對于決策樹的數(shù)增長系數(shù)設置,采用最大節(jié)點數(shù)為10000,最大樹深度為10,最小子節(jié)點大小為5,當不再提高準確性時停止構建模型。在數(shù)據(jù)準備方面,缺失值的最大百分比為70%,分級數(shù)為10,通過設置參數(shù)達到模型的最優(yōu)化。(4)支持向量機模型支持向量機模型的構建,主要通過SPSSModeler中的SVM模型實現(xiàn),SVM模型中有四種內(nèi)核函數(shù)可以選擇,分別是RBF函數(shù)(徑向基函數(shù))、多項式函數(shù)、Sigmoid函數(shù)和線性函數(shù),根據(jù)之前做的實驗以及前人文獻中的結論,本次實驗中選取徑向基核函數(shù)(RadialBasisFunction,RBF),RBF核函數(shù)能夠實現(xiàn)非線性映射,且需要的參數(shù)比多項式核函數(shù)少,模型簡單,經(jīng)過多次試驗,將gamma(伽瑪)系數(shù)設置為10,規(guī)則化參數(shù)為10,回歸精確度為0.1。1.3各反演模型精度對比按照1.2節(jié)所述策略完成BP神經(jīng)網(wǎng)絡(左上a模型)、隨機森林(右上b模型)、多元線性回歸(左下c模型)、支持向量機(右下d模型)的反演模型構建。四類反演模型在各個分區(qū)的測試數(shù)據(jù)集上的擬合散點圖如圖1.2所示。圖1.SEQ圖4.\*ARABIC2河南分區(qū)各反演模型擬合散點圖圖1.3湖北分區(qū)各反演模型擬合散點圖圖1.4湖南分區(qū)各反演模型擬合散點圖(注:橫軸為實測值,縱軸為預測值)對比分區(qū)域的各反演模型擬合散點圖,可以看出,與其他三種模型結果相比,在任何區(qū)域的隨機森林模型反演結果的離散程度均更低,預測值和真實值的散點分布圖更接近y=x這條直線。表1.5分區(qū)與全域模型精度對比區(qū)域模型R2MADRMSE全域(華中)BP0.6413.0019.20RF0.859.1513.43SVM0.6013.0620.18多元0.5813.7020.46湖南分區(qū)(湘)BP0.5813.4219.11RF0.926.439.18SVM0.5812.4219.17多元0.5613.1519.48湖北分區(qū)(鄂)BP0.6412.4017.57RF0.906.819.88SVM0.6711.7017.21多元0.6711.9316.89河南分區(qū)(豫)BP0.5715.1622.91RF0.879.1511.03SVM0.6111.1822.52多元0.5815.2222.71從三個分區(qū)與華中全域的模型精度結果中,可以看出多元線性模型精度最低,這證明傳統(tǒng)的回歸模型已經(jīng)無法滿足PM2.5反演要素間的關系,因而引入三種機器學習模型。通過對比結果可看出,不管是全域還是分區(qū),隨機森林模型在精度上遠優(yōu)于其他兩種傳統(tǒng)機器學習模型,R2在各個區(qū)域均很高(達到0.85以上),湖南和湖北兩個分區(qū)的R2并且誤差相對較小,其他兩種機器學習模型的精度大多在0.6左右,多元線性模型的決定系數(shù)都低于0.6。就隨機森林模型而言,全域模型的整體精度為:R2=0.85,MAD=9.15,RMSE=13.43;湖南分區(qū):R2=0.92,MAD=6.43,RMSE=9.18;湖北分區(qū):R2=0.90,MAD=6.81,RMSE=9.88;河南分區(qū):R2=0.87,MAD=9.15,RMSE=11.03。在各個分區(qū)和全域中,分區(qū)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030燃料電池行業(yè)市場趨勢分析產(chǎn)業(yè)技術發(fā)展方向報告
- 2025-2030熔噴布制造業(yè)市場供需考察與發(fā)展策略規(guī)劃分析研究報告
- 2025-2030溫控系統(tǒng)設備行業(yè)市場發(fā)展現(xiàn)狀及企業(yè)運營管理方案評估報告
- 2025-2030消防機器人移動承載能力化學防護性能測試報告
- 2025-2030消防安全系統(tǒng)設備行業(yè)市場供需分析及技術產(chǎn)業(yè)投資布局方案
- 2025-2030消費級無人機海外市場拓展策略與適航認證壁壘突破方案研究
- 2025-2030消費級無人機市場教育現(xiàn)狀與渠道下沉策略研究報告
- 2025-2030消費級基因檢測市場培育與精準醫(yī)療商業(yè)化路徑分析報告
- 2025-2030消費級3D打印設備材料兼容性擴展與版權保護機制報告
- 2025-2030洗衣膠囊技術與傳統(tǒng)投幣式洗衣機能耗對比實驗報告
- 軍隊院校招生文化科目統(tǒng)一考試模擬試卷
- 03課題三-建筑運行大數(shù)據(jù)安全與數(shù)據(jù)質量-20180703
- 工業(yè)區(qū)物業(yè)服務手冊
- 2024新能源集控中心儲能電站接入技術方案
- 河南省信陽市2023-2024學年高二上學期期末教學質量檢測數(shù)學試題(含答案解析)
- 北師大版七年級上冊數(shù)學 期末復習講義
- 零售行業(yè)的店面管理培訓資料
- 培訓課件電氣接地保護培訓課件
- 污水管網(wǎng)工程監(jiān)理月報
- 安徽涵豐科技有限公司年產(chǎn)6000噸磷酸酯阻燃劑DOPO、4800噸磷酸酯阻燃劑DOPO衍生品、12000噸副產(chǎn)品鹽酸、38000噸聚合氯化鋁、20000噸固化劑項目環(huán)境影響報告書
- GB/T 17215.322-2008交流電測量設備特殊要求第22部分:靜止式有功電能表(0.2S級和0.5S級)
評論
0/150
提交評論