版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
用電量數(shù)據(jù)確定性分析及預測模型分析綜述目錄TOC\o"1-3"\h\u8750用電量數(shù)據(jù)確定性分析及預測模型分析綜述 1220251.1數(shù)據(jù)準備 126441.2數(shù)據(jù)平穩(wěn)性檢驗 4234411.3Prophet模型分析與預測 7175221.3.1確定性因素提取 7161801.3.2Prophet模型擬合與評價 91.1數(shù)據(jù)準備本文所使用的數(shù)據(jù)是武漢市某行業(yè)的五個企業(yè)的日用電量數(shù)據(jù)。數(shù)據(jù)來源是網(wǎng)絡上的公開數(shù)據(jù)集。數(shù)據(jù)采集時間是2015年11月30日至2016年11月29日。該數(shù)據(jù)包括了該五個企業(yè)在這一年間每天的總用電量數(shù)據(jù),以及企業(yè)每天分別在峰平谷時間段的用電量數(shù)據(jù)。出于對數(shù)據(jù)來源公司隱私的保護,本文將用A、B、C、D、E分別代替在五個公司的名稱。本文數(shù)據(jù)為典型的時間序列數(shù)據(jù),首先通過時序圖來觀察數(shù)據(jù)的分布情況。圖1.1A公司用電時序圖圖1.2B公司用電時序圖圖1.3C公司用電時序圖圖1.4D公司用電時序圖圖1.5E公司用電時序圖通過觀察五個公司的時序圖可知,首先這五個公司在在一年內(nèi)的用電量都呈現(xiàn)出上升或下降的趨勢,并且都存在周期性的波動。從時序圖中可知,對于這五個公司來說在第一季度和第三季度都偏高,而第二季度和第四季度用電量數(shù)據(jù)偏低。為了更直觀展示出在不同季度用電量區(qū)別,將每個公司在不同季度的用電量繪制成條形圖,如下圖所示:圖1.6各公司各季度圖從條形圖中可以看到,除D公司以外,其他公司在第一、三季度的用電量都比第二、四季度高。D公司雖然第一季度的用電量較低,但第三季度的用電量仍處于全年最高水平。造成季度差異的主要原因是該五個公司的用電量數(shù)據(jù)是同地區(qū)同行業(yè)同時間段的數(shù)據(jù),產(chǎn)生這種季度性波動的原因主要是公司外部環(huán)境的影響,其中可能包括有政治經(jīng)濟、社會文化以及自然環(huán)境等因素的影響。除季度性差異外,通過時序圖可知在二月和十月各企業(yè)都存在一段持續(xù)的低水平用電,通過對數(shù)據(jù)分析可知,產(chǎn)生低水平的原因是春節(jié)和國慶節(jié)。由此可知,這五個公司的用電量除受到正常周末影響而產(chǎn)生周期性變動之外,還受到法定節(jié)假日的影響。節(jié)假日期間公司停工停產(chǎn),因此用電量會大幅度降低。這種節(jié)假日因素對后續(xù)用電量數(shù)據(jù)的分析和預測將會造成很大的影響,因此下文對時序數(shù)據(jù)的分析一定不能忽略這種影響。1.2數(shù)據(jù)平穩(wěn)性檢驗對于時間序列來說,平穩(wěn)性是一個非常重要的統(tǒng)計特征。如果一個時間序列是平穩(wěn)的,根據(jù)時間序列平穩(wěn)性的定義我們可以得到這個序列的均值是保持不變的,在這種情況下我們對時間序列的預測將是無意義的。因此,對于一個時間序列我們首先應該對其平穩(wěn)性進行檢驗,從而判斷下一步將如何對時間序列進行分析。時間序列平穩(wěn)性檢驗的方法主要有兩種,一種是通過對時間序列的時序圖和自相關圖進行繪制觀察的圖像檢驗方法,另一種是通過構造統(tǒng)計檢驗量進行假設檢驗的方法。根據(jù)上文中繪制的時間序列時序圖可知,該五個公司的用電量都存在上升下降的趨勢和周期性的波動。其次,用電量數(shù)據(jù)也并不是在均值周圍進行隨機波動。因此,初步判斷該五個公司的用電量都是非平穩(wěn)的。通過對時序圖觀察的圖檢法雖然操作簡單,可以直觀表現(xiàn)時間序列的波動變化,但其帶有非常強烈的主觀色彩,精確度偏低。因此,下文將通過更為精確的ADF單位根檢驗法對時間序列的平穩(wěn)性進行檢驗。從序列時序圖來看,序列有明顯的趨勢并且存在截距項,因此可以考慮ADF檢驗中既有常數(shù)均值又有線性趨勢的P階自回歸類型。假設條件為:H0:ρ=0(序列{本文通過EViews軟件進行ADF檢驗,檢驗結果如下圖:圖1.7A公司ADF檢驗結果由上表可知,A公司ADF檢驗的t統(tǒng)計量的值為-2.2305,小于檢驗水平為1%,5%,10%的臨界值,且P值為0.4706,遠遠大于0.05,因此接受原假設,認為A公司的用電量時間序列為非平穩(wěn)的。圖1.8B公司ADF檢驗結果由上表可知,B公司ADF檢驗的t統(tǒng)計量的值為-1.9423,小于檢驗水平為1%,5%,10%的臨界值,且P值為0.6300,遠遠大于0.05,因此接受原假設,認為B公司的用電量時間序列為非平穩(wěn)的。圖1.9C公司ADF檢驗結果由上表可知,C公司ADF檢驗的t統(tǒng)計量的值為-1.1124,小于檢驗水平為1%,5%,10%的臨界值,且P值為0.1049,大于0.05,因此接受原假設,認為C公司的用電量時間序列為非平穩(wěn)的。圖1.10D公司ADF檢驗結果由上表可知,D公司ADF檢驗的t統(tǒng)計量的值為-2.2188,小于檢驗水平為1%,5%,10%的臨界值,且P值為0.4771,大于0.05,因此接受原假設,認為D公司的用電量時間序列為非平穩(wěn)的。圖1.11E公司ADF檢驗結果由上表可知,E公司ADF檢驗的t統(tǒng)計量的值為-2.9604,小于檢驗水平為1%,5%,10%的臨界值,且P值為0.1451,大于0.05,因此接受原假設,認為E公司的用電量時間序列為非平穩(wěn)的。1.3Prophet模型分析與預測1.3.1確定性因素提取根據(jù)平穩(wěn)性檢驗可知,本文所采用的五個公司的數(shù)據(jù)都是非平穩(wěn)的。對非平穩(wěn)性時間序列的分析有確定性分析和隨機性分析兩種方法[29]。本文對企業(yè)用電量數(shù)據(jù)的分析的目的是得到可以用于對企業(yè)用電情況進行評價的指標,因此本文將選擇可以提取出用電量時間序列的趨勢和季節(jié)等因素的確定性分析方法。2017年facebook公司開源了一套時間序列預測工具——Prophet。不同于傳統(tǒng)的時間序列預測模型(ARIMA等),Prophet模型在實質(zhì)上是對時間序列數(shù)據(jù)的曲線擬合,同時對數(shù)據(jù)中的節(jié)日效應和趨勢變化點具有出色的適應能力[30]。通過對本文數(shù)據(jù)的時序圖和實際數(shù)據(jù)的觀察,企業(yè)用電量數(shù)據(jù)有明顯的季節(jié)性因素,并且在元旦春節(jié)國慶等節(jié)假日,企業(yè)的用電量數(shù)據(jù)也會產(chǎn)生很大的波動。因為Prophet模型對有明顯季節(jié)性因素和受節(jié)假日影響的時序數(shù)據(jù)有較好的擬合效果,因此本文將選擇使用Prophet模型對企業(yè)用電量數(shù)據(jù)進行擬合和預測。Prophet模型的趨勢擬合模型主要包括飽和增長型模型和分段線性增長型模型。根據(jù)用電量數(shù)據(jù)的變化情況,選擇分段線性增長模型擬合趨勢。根據(jù)用電量數(shù)據(jù)的特性,企業(yè)的用電量數(shù)據(jù)會受到企業(yè)是否開工的影響,所以主要的周期性表現(xiàn)在以每周為單位的變化。對數(shù)據(jù)觀察后發(fā)現(xiàn)由于節(jié)假日放假會導致公司用電量大幅度降低,因此在使用Prophet模型的時候,手動添加holiday屬性,將數(shù)據(jù)采集年內(nèi)的法定節(jié)假日手動進行設置。利用Prophet模型對時序的因素提取后的結果如下圖所示:圖1.12A公司因素分解圖圖1.13B公司因素分解圖圖1.14C公司因素分解圖圖1.15D公司因素分解圖圖1.16E公司因素分解圖使用Prophet模型對五個公司的用電量時間序列進行分解,按照每個圖中從上至下進行分析,第一個圖形為對時間序列趨勢擬合圖,每個企業(yè)的用電量趨勢各有不用,利用用電量趨勢的不同,可以將企業(yè)的用電量趨勢作為對企業(yè)評價的指標;第二個圖形為節(jié)假日因素的影響,在手動輸入元旦、春節(jié)、五一、國慶等節(jié)假日數(shù)據(jù)后可清楚看到每個企業(yè)受節(jié)假日影響很大,并且在春節(jié)和國慶節(jié)這種長假受到的影響更明顯;第三個圖形為一周內(nèi)用電量數(shù)據(jù)的變化情況,對于這五個公司來說在周末兩天的用電量都顯著下降,一周內(nèi)五個公司的用電量變化情況也大致相似。1.3.2Prophet模型擬合與評價提取出趨勢、季節(jié)、節(jié)假日等因素后,進行Prophet模型的擬合,并對模型擬合的精度進行評估。選擇將數(shù)據(jù)集的前80%作為訓練集,后20%作為測試集,對模型的預測能力進行評估。利用均方根誤差公式對預測能力進行評價,公式如下:RMSE=1ni=1n式中,RMSE為均方根誤差,yi為實際值,y^i為預測值。根據(jù)RMSE計算,五個公司的預測誤差分別為9.83%,10.45%,11.37%,12.78%,11.圖1.17D公司模型擬合圖在上圖中,黑色點代表實際數(shù)據(jù),藍色線條代表擬合數(shù)據(jù),預測誤差總的來說偏大,主要原因在于第三季度的數(shù)據(jù)擬合誤差較大,這是因為本文所使用的數(shù)據(jù)量不夠,不能很好擬合出企業(yè)用電量在一年中不同季度的變化情況。從上文中可知這幾個公司在第三季度的用電量通常會較高,這可能是與該行業(yè)的規(guī)律有關。如果有更大的數(shù)據(jù)量將可以擬合出行業(yè)在一年中用電量的規(guī)律,從而在第三季度擬合出更高的用電量。雖然預測誤差偏大,但是基于預測的用電量數(shù)據(jù)只是對企業(yè)評價的其中一個指標,針對誤差較大的情況
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 線槽標準施工方案(3篇)
- 基建類財務管理制度(3篇)
- 執(zhí)法部門因管理制度(3篇)
- 2026北京人民郵電出版社校園招聘備考考試題庫及答案解析
- 護理信息技術應用實訓課件
- 2026湖北荊州市荊州區(qū)事業(yè)單位人才引進57人備考考試題庫及答案解析
- 2026廣東珠海市婦幼保健院(珠海市婦女兒童醫(yī)院)、華南理工大學附屬珠海婦兒醫(yī)院面向應屆畢業(yè)生招聘事業(yè)單位人員2人備考考試試題及答案解析
- 2026貴州貴陽市息烽縣衛(wèi)生健康局公益性崗位招聘2人參考考試題庫及答案解析
- 右手機器絞傷的緊急處理方法
- 2026福建福州市水路運輸應急保障中心編外人員招聘1人參考考試題庫及答案解析
- 2025四川省土地租賃合同范本
- GB/T 5709-2025紡織品非織造布術語
- 光伏發(fā)電項目風險
- 企業(yè)微信使用手冊
- 綠化養(yǎng)護驗收實施方案1
- 2024年理財行業(yè)高質(zhì)量發(fā)展白皮書-農(nóng)銀理財
- 危險化學品經(jīng)營單位(安全生產(chǎn)管理人員)考試題及答案
- UL498標準中文版-2019插頭插座UL標準中文版
- 《非物質(zhì)文化遺產(chǎn)》課程教學大綱
- 小學英語名師工作室工作總結
- 居民自建樁安裝告知書回執(zhí)
評論
0/150
提交評論