版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1前言1.1研究背景及意義在發(fā)電廠或電力系統(tǒng)中,任意時刻所承擔的所有耗電設備消耗的電功率之和,稱作電力負荷,單位:“KW”。雖然電力負荷的標準單位是“KW”,但于實際運行工作中我們經常用來表征負荷的方式為電流。電力系統(tǒng)的負荷分類研究就是研究電力負荷的組成,從而劃出某一區(qū)域(或一個單位等)內各類負荷組成的種類、占比及其相互之間的關系[1]。對電力負荷進行分類,它的實質就是數據挖掘中聚類分析在電力系統(tǒng)中的應用。其結構日益復雜化、規(guī)模日益龐大化等特點在我國電力系統(tǒng)的發(fā)展下逐漸顯露出來,此外,需求側負荷特征的多樣化及其管理技術(DemandSideManagement,DSM)在系統(tǒng)中的廣泛應用,也令電力負荷分類成為電力系統(tǒng)中重點且基礎的工作。一種好的負荷分類方法作為電力系統(tǒng)規(guī)劃、分時電價、錯峰管理、負荷預測的基礎,能給電力系統(tǒng)提供合理、準確的依據和引導,不僅對電力系統(tǒng)有利,而且對用戶有利[2]。根據電力負荷的不同標準存在多種分類類型,我國目前施行的分類標準是依據用戶用電所屬的行業(yè)和用戶的經濟活動特點進行的,它將用電負荷劃分為工業(yè)負荷、農業(yè)負荷、商業(yè)負荷和城鄉(xiāng)居民及其他負荷四大類。但是在實際應用中,該方法存在著如下問題:用戶負荷特性的多樣性在相同行業(yè)中不能被充分地體現。往年直接根據用戶所屬行業(yè)進行分類的方式顯然是不合理的,隨著現代工業(yè)生產模式轉變、農業(yè)工業(yè)化的發(fā)展和居民用電習慣改變等因素,同時各地負荷構成復雜,地區(qū)負荷可能存在某些用戶負荷雖然屬于同一行業(yè),但由于其自身的用電的特性導致負荷不一致的情況,其負荷曲線也存在著較大的差異。無法展現不同電網的變化及差別。隨著我國經濟社會的發(fā)展、人民生活的復雜化及多樣化,電網中隨即出現了一些新興負荷類型的用戶,這些新類型用戶的負荷呈現出與傳統(tǒng)負荷差異較大的負荷特性,如果將此類新類型的用戶直接規(guī)類到已被定義的類型中,會導致分類的不準確,無法準確得知負荷狀況,因而有必要重新劃分與定義負f類型。另外,不同地域電網間的負荷組成也存在一定的差別,也可能只包含上述負荷類型中的一部分,如某一地域大多數用戶的負荷特征呈現同種類型的可能性,所以需要根據實際情況對負荷類型進行劃分,不應該盲目的確定負荷類型。不準確的負荷分類結果,會導致阻礙其下一步運用。負荷分類本應是一類無監(jiān)督分類問題,只是傳統(tǒng)的負荷分類方式,并沒有考慮用戶負荷的實際變化規(guī)律、特性和負荷構成情況,只憑以往的結果來進行引導分類,確認負荷類型,理論依據嚴重缺失,人為因素對分類結果的影響巨大,主觀意識嚴重影響分類結果。因此負荷分類結果是否精準、合理無法保證,且直接影響上述基礎的模塊進一步運用,比如會導致負荷預測時的準確度降低,供電公司依據不同負荷類型所擬定的電價不合理等等。電力負荷數據日益海量、復雜,分類困難。目前我國電力系統(tǒng)的自動化水準不斷提升,并廣泛運用到各種負荷檢測裝置之中,經已配置的數據檢測系統(tǒng),各級電網調度中心和變電站皆獲得了大批相關用戶的負荷數據。隨著電力系統(tǒng)發(fā)展,相關電力負荷的數據量逐年上漲,并跟隨著不斷增加新的負荷標準,在讓提高負荷分析的精確性變?yōu)榭赡艿耐瑫r,也讓分析過程變?yōu)楦訌碗s的工作,龐大的數據量成為負荷分類研究問題上巨大的麻煩。綜上所述,目前分類方法已難以適應負荷分類的各種需求,鑒于負荷分類于系統(tǒng)的重要性以及當前負荷分類時所出現的問題,亟待對更合理的負荷分類方法進行研究,以期發(fā)現一種更適合當前負荷分類要求的負荷分類方法[3]。為解決上述出現的問題,迫切需要一種可以迅速、精確處理海量數據的技術方法進行負荷分類,并實現根據負荷數據特性來自動獲取負荷類型個數的電力用戶負荷分類方法,從而降低人為因素對分類結果的影響,為有關電力部門提供精確的負荷分類方法和結果,并成為有關電力部門進一步運用的基礎。隨著我國電力系統(tǒng)的改革和市場化的推進,供電公司期望分別針對每個客戶的特點來提供個性化服務,那么對用戶進行精確分類且通識各類負荷的特點變得十分重要。在此背景下,本文對數據挖掘中的幾種聚類方法進行分析研究,最終選擇K-means聚類算法對電力負荷數據進行分類,并在MATLAB平臺上進行仿真實現。1.2電力用戶負荷分類電力系統(tǒng)中含有各種類型的電力負荷,通常稱各種不同性質的負荷總和為系統(tǒng)總負荷[4]。為方便進行負荷管理,有必要對各類電力系統(tǒng)中各類型的負荷進行精確、合理的分類,令不同類型負荷間展現差異較大的特征,同一類負荷具有相似甚至相同的特征。當前在負荷分類方法中,根據不同的分類標準,一般可以對負荷做出下列不同的劃分,如下圖1.1所示。雖然能夠按照如圖標準對電力系統(tǒng)的負荷類型進行分類,但有時分類結果并不準確。在實際分類時,可能會出現某些特殊負荷的歸類無法確定等問題。為解決這些問題,一般由供電公司主觀進行決定其歸屬,所以在進行電力負荷分類時,某些供電公司可能存在更加精細標準的分類準則。圖1.1電力負荷分類負荷分類的根本意義是,作為電力市場分析、規(guī)劃等應用的基礎分析和參考,隨著分類方法的研究逐漸完善,分類方法的應用也隨之深入,它的應用研究主要表現在下列四個方面:(1)訂制電價現如今,有關我們國家電力體制改革的呼聲日益強烈,今后電力市場的發(fā)展需求將會逐漸的展露出目前施行的電價體制里電價分類不完全合理的不足。目前,大多以用戶用電行業(yè)和用途劃分為標準將電價歸類,定制電價時政策將起決定性作用,忽略掉用戶的用電負荷特性,以致企業(yè)的生產成本難以通過電價展現出來,并且電價難以應對市場經濟的需求,致使電力資源很難合理地實現優(yōu)化配置。但隨著電力改革的深入,今后電力用戶將能夠自由地挑選售電商進行消費,如此會迫使各售電商依照各類用戶的用電行為、習慣等不同特征進行市場劃分,擬定不同的營銷手段及更加公平合理的電價,來競爭更廣泛的消費人群。有專家提出了一種電價決策方案,這種決策方案在保證負荷分類結果的前提下,又考慮了用電特性,這樣能夠為有關供電部門制定電價的時候提供依據;另有學者提出了完善峰谷電價的一種方式,這種方式先是把用戶負荷特性分類處理,然后對各種用戶建立起在不同時段的成本分攤模型,剖釋了不同用戶在峰谷電價問題上的響應程度。(2)負荷預測直接根據總負荷的現有數據做出預測,亦或是首先分別對每一類負荷做出預測,然后匯總為總負荷預測,以上為預測總負荷比較常見的兩種方式。直接對總負荷進行預測不僅較為容易實現,而且可以使負荷的變化趨勢可視化;而在進行分類負荷預測的時候,可以看到某種負荷可能出現的異常變化趨勢,而且基于對各類負荷進行單獨預測的結果,綜合得出的負荷預測結果相較于直接預測的結果更為精確。現在,進行分類預測的方法如下:先是將預測系統(tǒng)范圍內的用戶進行負荷分類,然后做出預測,把得出的各類用戶的負荷預測曲線進行加權累加,就能夠得出系統(tǒng)總的日負荷預測曲線。(3)系統(tǒng)規(guī)劃與負荷管理負荷分類對電力系統(tǒng)的合理規(guī)劃問題進行了技術指導,用戶電力負荷的組成情況是系統(tǒng)總負荷需求的決定性因素。根據規(guī)劃地域各種類型的用戶用電習慣和他的增長方式而組建的負荷預測模型更為準確,此模型的優(yōu)點十分顯著,比如使區(qū)域之間聯(lián)絡線的傳輸功率以及地區(qū)裝機容量與負荷之間可能出現的的不匹配的情況大大降低[5]。如今,由于電力需求側管理(DSM)的廣泛推進,電力用戶已經具備參與市場的條件,急需用戶和電力部門建立較為融洽的合作關系,共同致力于實現電力系統(tǒng)的利益最大化,合理的負荷分類是制定相關政策的基礎依據。DSM經過分析系統(tǒng)的負荷構成,從而引導用戶在用電高峰時段減少用電設備的電力消耗,相對在低谷時段可根據需求選用合適的用電設備,從而對峰谷時段進行平衡,此手段具有降低負荷的峰谷差、提高用電負荷率、降低發(fā)電成本、優(yōu)化電力系統(tǒng)、提高經濟效益等益處;除此之外,降低最大負荷值,減小裝機容量需求,節(jié)約了我們國家電力工業(yè)的建設投資。(4)綜合建模在綜合負荷具備隨機性、分散性、多樣性等特點的大環(huán)境下,負荷建模研究被大眾所關注的核心內容。構建一個結構合理、參數精確的綜合負荷模型是電力系統(tǒng)仿真的可靠性和準確性的保障。每種類型負荷所展現出其單獨具備的特點,致使出現多種負荷模型。負荷分類把電網中負荷特性相近的負荷歸為同類,并依照它的特征組建一類模型用以表述這類負荷,讓得出的模型能夠最大化地表現出相同類型負荷所具備的共同特征,令該模型更加廣泛地應用到負荷建模研究中。負荷分類于電力系統(tǒng)中一般包含上述幾點應用,它會直接表現出對電力系統(tǒng)和用戶的益處[6]。精確的負荷分類方式能夠減少電力系統(tǒng)的建設投資、運行成本,完善和運營電力市場,對電網安全、經濟、優(yōu)質的運行起保障作用;廣大用戶可以真切地感受到電力系統(tǒng)的益處,在降低系統(tǒng)運行成本和引導用戶減小負荷峰谷差兩條件下,降低用戶的電力負荷消耗,與此同時將會引導某些高能耗企業(yè)進行低谷時段生產和改變員工作息,從而讓交通、供水等基礎供應行業(yè)進行錯峰,令社會資源得到均衡分配。1.3負荷分類方法的國內外研究現狀現如今,負荷分類方法都是以聚類數目確定、初始類中心確定、合適聚類方法的選擇等方面進行研究的[7]。隨著電力體制改革的深入和智能電網構建的推進,負荷分類方法的探究逐漸深化,近期分類方法的主要研究成果有下列幾點。將基于模糊C均值算法等模糊聚類算法用于負荷分類研究中,此類算法通過建立樣本描述類別的不確定性,來量化類別與表征樣本間的隸屬關系,那么得出的聚類結果就會變得更為客觀,并且由于該算法可以精確地識別出孤立點,從而可以迅速確定出一些具備特殊特征的樣本;不過此類算法也存在易被發(fā)現的不足,像是它存在對初始聚類中心比較敏感、不容易確定聚類個數和常常陷入局部最優(yōu)等缺點,直接利用FCM算法進行負荷分類會致使分類結果不精確,合理性不足,并且此類算法在所處理的數據呈現稀疏分布時展現出不穩(wěn)定的缺點;因此,許多文獻對此類算法進行完善,像某組學者提出一種綜合C-均值聚類算法與SOM神經網絡兩種算法所綜合的負荷分類方法,先是通過SOM神經網絡算法計算出聚類的個數和每類電力負荷的中心點,然后把它的結果當成C-均值聚類算法的初始輸入數據,這種綜合算法匯集了兩種基礎算法的優(yōu)勢,這將會提高C-均值聚類算法的收斂速度和精度[8]。另一組學者提出了一種基于自適應模糊C均值算法,這種算法將模糊C-均值聚類算法需要提前確定聚類個數的缺點進行完善,通過于傳統(tǒng)算法中引入聚類有效性函數的方式,令算法可以根據數據特性自動確定聚類個數[9]。神經網絡理論同時被大量應用到電力負荷分類的研究中,如有文獻闡述了某種利用神經網絡來做出負荷分類的方案;有文獻研究了SOM算法的相關理論;有文獻而是為了獲取總負荷曲線,先是利用神經網絡算法將負荷數據進行分類從而獲取不同類型的典型負荷曲線,最后將不用種類曲線進行疊加。但是該算法存在不足:它的收斂速度很慢、樣本訓練過程復雜且不靈活、訓練樣本病態(tài)對結果影響很大等。另外,有國外專家提出在負荷分類中使用兩階段聚類法,這種算法在第一階段使用某種聚類方法獲取每類用戶的典型負荷曲線,第二階段利用已獲取的典型負荷曲線將全部用戶做出分類,追其根源是追求所選取的樣本質量;一種源于圖的譜分割的譜聚類算法同樣被負荷分類研究所利用,這種算法不用預先確定分類的最優(yōu)個數,不過不容易選擇它的相似度函數;另存在基于免疫網絡理論等負荷分類方法,相關研究依舊處于理論探究階段。如今,有關對分類方法的研究都是以怎樣自動獲取最佳聚類數、確定初始聚類中心點、根據需求選擇的合適聚類方法等方面為中心而進行的。K-means算法作為聚類分析里一種普遍的、原始的分類方法,依靠著它理論可靠、具備有效處理大數據集、收斂速度快、實現簡單等優(yōu)勢被研究者大量使用。本文將針對幾種常見的聚類算法進行分析研究,根據提供的電力負荷數據的特點,選出最適合電力負荷分類的方法。1.4本文的主要工作本文總共分為四章,其中分別介紹電力負荷分類和幾種常用的聚類分類的理論思想,并最終選擇K-means聚類算法對電力負荷數據進行仿真模擬。其中,第一章主要介紹電力用戶負荷分類和電力負荷分類方法在國內外的研究現狀。第二章解釋了聚類的定義并舉出了多種聚類算法并分別從理論上介紹,而后了解各種聚類算法的思想流程并對其優(yōu)缺點進行了分析和比較。第三章選取K-means聚類算法進行重點分析,對其思想流程做出詳細介紹,分析其優(yōu)缺點并進行現有改進。第四章結合電力負荷數據,利用MATLAB對K-means聚類算法進行仿真。2聚類算法的分析與比較2.1聚類的定義聚類的定義是通過某種或某幾種聚類算法將數據庫中的數據對象的集合劃分成為一系列有意義的子集。通過聚類算法進行偏差分析和概念描述,使得人們對客觀現實的認知形式作出了進一步了解和改觀。聚類是基于傳統(tǒng)的模式識別方法和現代的數學分析學兩種技術來進行的分類方法。聚類就是依照一些特定標準將某個數據集切割成不同的類,這樣令相同分類中的數據對象盡可能大概率相似,與此同時令不同分類中的數據對象也盡可能地大概率相異。也就是聚類后相同分類的數據盡可能地聚集在一起,不同分類的數據盡可能地分離。聚類是基于“物以類聚,人以群分”古老的樸素思想而產生的,它的目的是將數據庫中大量的數據依照相應的原則分配為不同的種類,通過聚類的分類原理,使同一類別的數據對象之間具有較高的相似度,不同類別的數據對象之間具有較低的相似度。截至日前,國內外大量聚類算法[10]已經被國內外的研究人員匯編成型,縱使目前存在大量成型的聚類算法,但是不存在任意一種聚類算法技術能夠做到兼顧各種多維數據所呈現出來的各類不同的結構,它們都或多地存在著一些不足和缺陷。目前國內外專家和學者們仍然將聚類算法的改進和探討作為研究的熱門話題。2.2主要聚類算法分類聚類算法有很多種,按照不同的劃分原則也將被分成許多種類。不同的聚類算法適用的場合也不盡相同,在選取具體的算法之前要考慮數據的屬性、聚類的目標和應用背景等因素。本章將會挑選四種比較常用的算法進行分析和比較,包括基于密度的聚類(DBSCAN)、K-NN聚類、基于神經網絡的聚類和K-means聚類這四種算法進行原理分析和比較。我們選擇K-means聚類算法,并將它的原理在第三章中著重介紹。2.3基于密度的聚類算法(DBSCAN)基于密度的聚類算法是假設聚類結構可以由樣本分部的緊密程度而確定的一種算法。通常情況下,密度聚類算法根據樣本密度的關系來觀測樣本間的可連接性,同時在可連接樣本進一步擴展聚類簇的條件下最終獲取聚類結果[11]。這種聚類方法把簇定義成密度相連的點的最大集合,可以將具備足夠高密度的區(qū)域劃分成簇,同時能夠在噪聲的空間數據庫內找到任意形狀的聚類。DBSCAN是密度聚類算法中最常用的一種算法,這種算法以一組“鄰域”參數為條件去刻畫樣本分布的緊密程度[12]。圖2.1給了幾個概念的直觀顯示。圖2.1DBSCAN定義的基本概念:虛線顯示出鄰域,是核心對象,密度直達,密度可達,密度相連?;诿芏鹊木垲愃惴鞒虉D如下圖2.2所示。圖2.2基于密度的聚類算法流程圖2.4K-NN聚類K-NN算法的核心思想為假設一個樣本于特征空間內的K個最相鄰的樣本中的大多數樣本同屬某一個類型,那么這個樣本同樣隸屬于此類型,而且具備此類型中樣本的特性[13]。這種方法于確定分類決策中僅僅依據最鄰近的一個或者幾個樣本的類型來決定未分類樣本所隸屬的類型。K-NN聚類算法在類別決策的時候,僅以極少量的相鄰樣本為基礎[14]。因為K-NN聚類算法主要依靠周圍有限的鄰近的樣本,而非依靠判別類域的方式確定所屬類別,所以對于類域的交叉或重疊較多的未分類樣本集而言,K-NN聚類算法是比其他聚類算法更優(yōu)的方法。K-NN聚類一般采用歐氏距離(EuclideanDistance)當成它進行分類的模型,歐氏距離的數學模型概念在下面給出:設在n維空間中有兩個點和,這兩個點的歐氏距離計算公式如下所示:(2-1)其中,是維數,和分別是和的第個屬性值。2.5基于神經網絡的聚類(SOM)2.5.1基于神經網絡的聚類算法的思想及流程1981年,赫爾辛基大學的TeuvoKohonen根據大腦處理外界信號的方法特點,提出了一種自組織神經網絡的模型,即基于神經網絡的聚類,又被稱作自組織特征映射的神經網絡(SOM)[15]。這種神經網絡算法思想的本質為:解決人腦中的自組織如何處理來自外界的信息并形成概念的問題。和其他的聚類算法大體一致,基于神經網絡聚類算法同樣是依靠迭代算法來優(yōu)化目標函數,進而達成最佳的聚類目的[16]?;谏窠浘W絡的聚類層次結構圖如下圖2.3所示。圖2.3基于神經網絡的聚類層次結構圖基于神經網絡的聚類算法的流程圖如下圖2.4所示。圖2.4基于神經網絡的聚類流程圖2.5.2基于神經網絡的聚類算法的優(yōu)缺點分析基于神經網絡的聚類算法的優(yōu)點是,它具有很強的容錯能力,即為出于某種原因,導致數據或者文件出現冗余的、不完整的,或者數據本身就帶有較多的噪聲數據和矛盾的數據,基于神經網絡的聚類也能在此基礎上進行問題的求解[17]。并且作為數據挖掘中聚類環(huán)節(jié)的算法之一,它具備對非線性的數據進行快速建模的能力[18]。然而,基于神經網絡的聚類的缺陷也十分明顯,在一般情況下,因為基于神經網絡的聚類算法復雜程度較高,所以將導致它的聚類速度很慢、算法執(zhí)行時間很長,且需要輸入足夠多的數據對象,才能使神經網絡收斂于某一穩(wěn)定狀態(tài)[19]。所以當面對海量的數據信息的時候,使用基于神經網絡的聚類算法進行目標預測時,會有效率低下、訓練時間長等缺點。2.6本章小結本章首先介紹了聚類的定義,選取了幾種常用的聚類算法做出介紹,包括基于密度的聚類算法(DBSCAN),K-NN算法,和基于神經網絡的聚類算法(SOM),詳細闡述了以上幾種算法的基本思想及算法流程。本文將在第三章對K-means聚類算法進行詳細介紹。3K-means聚類算法研究與分析3.1K-means聚類算法的思想及流程MacQue提出的K-means聚類算法是一種經典的劃分聚類算法,在這之中,K值表示數據集最終被聚成的聚類數目,means為平均值,代表著每類數據的算數平均值,即為聚類中心[20]。因此,K-means聚類算法也稱作K-均值聚類算法。K-means聚類算法的基本思想:K-means聚類算法是一種動態(tài)聚類算法,也叫作逐步聚類法,在聚類算法迭代之前,該算法首先從數據集中隨機依次選取K個數據對象作為K個初始聚類中心,而后根據所分類內對象的均值,即聚類中心,依次將其他的數據對象劃分到與其最近的聚類中心所在的類中,數據對象分類完畢后,計算每個聚類中心的均值,更新該均值作為新的聚類中心點,迭代上述聚類過程。直到聚類中心不再產生變化,即聚類中心均值數值收斂或是聚類準則函數連續(xù)值相差小于給定閥值為止。一般采用的目標函數即聚類準則函數是誤差平方和準則函數[21]。在每次迭代中均要考察樣本分類的準確性是K均值聚類算法的一個的特點。K-means聚類算法是最經典的聚類算法之一。該算法是一種基于距離的聚類算法,基于距離的聚類算法主要指把距離函數當成相似性度量的評價標準的聚類算法,距離函數主要有以下幾種:1.歐氏距離:歐氏距離的計算公式如下式:(3-1)2.明氏距離:明氏距離的計算公式如下式:(3-2)
其中,t為一個正整數。可以明確地看出,在式(3-2)中當t=2時,會得到歐式距離,所以歐氏距離可以看作明氏距離的一個特例。歐氏距離是聚類算法中用以度量數據對象間相異性最常用的方法之一。與其相近的相似度度量方法還有曼哈頓距離、馬氏距離等,不過諸類相似度度量方法并不常用,他們分別定義如下:3.曼哈頓距離:
(3-3)4.馬氏距離:
(3-4)在式中,表示樣本協(xié)方差陣的逆矩陣,T表示矩陣的轉置?;贙-means聚類算法快速且高效的特點,該算法被廣泛地應用到大規(guī)模的數據聚類中,它是一種頗具影響力的聚類算法。在一般情況下,K-means聚類算法容易得到指定類別數的聚類結果,而K值確定是實踐經驗積累的結果[22]。圖3.1為K-means聚類算法流程圖:圖3.1K-means聚類算法流程圖為了方便算法描述,定義已知一個含有個數據的樣本集合為,即(3-5)其中,是一個維向量,表示第個的數據的個不同屬性,是樣本容量。聚類中心為:(3-6)其中,是第個類的中心點,每個中心點都含有個不同的屬性,是聚類個數。定義1:兩個數據和之間的歐幾里得距離為,其表示如下:(3-7)其中,,,是簇類個數。定義2:同一簇類的中心點為表示如下:(3-8)其中,是同一簇類中數據的個數,。定義3:把類內誤差平方和作為準則函數,如下式:(3-9)其中,,,是簇類個數。3.2K-means聚類算法的優(yōu)缺點分析K均值聚類算法具備算法簡單、理論可靠、收斂速度快、能有效地處理大數據集等優(yōu)點,因此在科學和工程等高新技術產業(yè)領域內被大量應用。而且K-means聚類算法可以有效地減少聚類計算的迭代次數,提高分類的準確性,同時可以根據負荷的數據特點實現自動化的科學分類,在電力負荷分類問題中K-means聚類算法的分類結果明顯優(yōu)于其他聚類方法。但是傳統(tǒng)的K-means算法也存在著在處理大量多維數據時選取聚類中心的問題。3.3K-means聚類算法的現有改進現如今有關K-means聚類算法的改進出現了多種方式,K-means聚類算法在國內外的研究成果主要包括:有學者提出把決策樹算法綜合到K-means聚類算法的改進中[24],這樣的改進方式雖增強了算法的抗噪性,但算法的計算量較之前大大提升;還有學者把遺傳算法綜合到K-means聚類算法中,這種改進方式完善了算法的聚類效果[25];另有研究者提出了一種模糊K-means聚類算法,這種新型算法引入處罰項到目標函數中,會令算法對初始聚類中心的敏感度降低,提高了算法聚類結果的準確性??梢钥闯觯绾芜x擇K-means聚類算法的初始聚類中心將會是今后如何優(yōu)化K-means聚類算法的重點研究方向。3.4本章小結本章重點對K-means聚類進行介紹,首先介紹了K-means聚類算法的基本思想和算法流程,然后對K-means算法的優(yōu)缺點進行介紹,最后介紹了一下該算法的現有改進。鑒于K-means聚類算法的應用廣泛性及其分類準確性和科學性,本文將采用K-means聚類算法進行電力負荷分類的仿真,并在第四章中展示通過K-means聚類算法于Matlab上仿真得到的電力負荷分類結果。4K-means聚類算法在電力負荷分類的仿真設計4.1電力負荷數據來源進行算例仿真的電力負荷來源于文獻[29],該負荷數據是由某供電公司提供,該數據體現了三十一個不同用戶在一天內(從0時到23時)的用電量。利用MATLAB進行繪圖,得到此三十一個用戶的日負荷曲線圖,如下圖4.1所示。表3.2用戶的日負荷T0123456789101110.10.360.430.480.420.420.010.010.010.010.010.0120.150.320.310.30.310.320.320.170.170.090.10.11…………………310.2350.2350.2350.220.230.230.2150.230.250.2450.220.2T12131415161718192021222310.010.010.010.010.010.010.010.010.010.010.060.0120.120.160.120.160.130.140.140.160.1550.150.180.022…………………310.1950.1950.210.220.220.220.1850.190.180.1650.1650.16圖4.1用戶日負荷曲線圖根據上圖不同用戶的日負荷曲線圖我們可以先進行粗略的分析,首先,我們可以把一天中的24個小時分為以下幾個階段:(1)0時-7時,這個時段屬于低峰時段,一般用戶在此時段屬于休眠狀態(tài),用電量會比較低,但有些用戶為了避開用電高峰期會選擇在這個時段進行電力消耗。(2)7時-11時,這個時段處于高峰時段,無論是通勤路上的交通運輸還是進行日常的生產生活消耗,都無疑是較大的消耗。(3)11時-13時,這個時段是一個較短的低峰時段,主要原因是午飯、午休。但不排除餐飲、服務行業(yè)在這個時段進入他們的用電高峰期。(4)13時-20時,這個時段是一個用電的高峰時段,結束午飯和午休后迎來了正常的工作和生產,之后過度到下班的通勤交通消耗和晚飯、娛樂活動等消耗。(5)20時-24時,這個時段也屬于低峰時段,原因與0時-7時時段基本相同,多數用戶結束了一天的生產和生活工作后需要進行休息,但有些用戶為了避開用電高峰期會選擇在這個時段進行電力消耗。所以我們可以將不同用戶的日電力負荷消耗粗略的分為如下幾類:第一類用戶的用電高峰期在17時到23時,其余時間用電平緩,此類用戶可以看作白天工作,夜晚回家以后導致用電量增加的上班族。第二類用戶在夜間和中午時段負荷較小,而在上午和下午常規(guī)的工作時間負荷較大,應屬于常規(guī)工作用戶,一般這類用戶大多是學校以及正常工作制的公司企業(yè)等正常作息的單位。第三類用戶在0到5時和20到23時(夜間)負荷較大,而在6到19時(白天)負荷較小,顯然屬于避峰用戶。第四類用戶負荷曲線較為平緩,但是夜間用電量比白天稍大,但是波動較小,可以看作不同于第二類的常規(guī)工作用戶。所以我們認為K=3,4或5都可能是最優(yōu)的電力負荷分類結果。下面我們開始進行仿真實驗,從而驗證我們的初步判斷結果,得出最終的結論。4.2不同K值下的k-means仿真結果4.2.1K=2時的仿真結果在上文中提到,K-means聚類算法的K值是需要自己設定的。我們則分別賦予K不同的值,然后對聚類仿真結果進行分析,從而選擇最佳聚類分類方法時的K值。首先選擇K=2來開始仿真實驗。K=2時的仿真結果如下圖4.2所示。圖4.2K=2時分類結果由上圖可以看出,經過K-means(K=2)聚類以后將31個用戶的日負荷曲線分為兩類,第一類用戶在0到5時和20到23時(夜間)負荷較大,而在6到19時(白天)負荷較小,顯然屬于避峰用戶。第二類用戶的曲線較為復雜,特征也不是十分明顯,顯然可以再進行更細致的分類,說明當K=2時,k-means的分類結果不是特別理想。還需進行K=3時的仿真。4.2.2K=3時的仿真結果K=3時的仿真結果如下圖4.3所示。圖4.3K=3時分類結果由上圖4.3可以看出,經過K-means(K=3)聚類以后將31個用戶的日負荷曲線分為3類。第一類用戶在0到5時和20到23時(夜間)負荷較大,而在6到19時(白天)負荷較小,顯然屬于避峰用戶。第二類用戶在夜間和中午時段負荷較小,而在上午和下午常規(guī)的工作時間負荷較大,應屬于常規(guī)工作用戶,一般這類用戶大多是學校以及正常工作制的公司企業(yè)等正常作息的單位。第三類用戶的用電高峰期在17時到23時,其余時間用電平緩,此類用戶可以看做白天外出工作,夜晚回家后導致用電量增加的上班族。此時的分類情況相比于K=2時,分類效果明顯好了一些,但是第二類和第三類的負荷曲線還是可以看出明顯的不同,還需要更為細致的劃分。所以需要繼續(xù)進行K=4時的仿真。4.2.3K=4時的仿真結果K=4時的仿真結果如下圖4.4所示。圖4.4K=4時分類結果由上圖4.4可以看出,經過K-means(K=4)聚類以后將31個用戶的日負荷曲線分為4類。第一類用戶的用電高峰期在17時到23時,其余時間用電平緩,此類用戶可以看作白天工作,夜晚回家以后導致用電量增加的上班族。(同分3類情況下的第三類用戶為同一特征用戶)。第二類用戶在夜間和中午時段負荷較小,而在上午和下午常規(guī)的工作時間負荷較大,應屬于常規(guī)工作用戶,一般這類用戶大多是學校以及正常工作制的公司企業(yè)等正常作息的單位。(同分3類情況下的第二類用戶為同一特征用戶)[30]。第三類用戶在0到5時和20到23時(夜間)負荷較大,而在6到19時(白天)負荷較小,顯然屬于避峰用戶。(同分3類情況下的第三類用戶為同一特征用戶)。第四類用戶負荷曲線較為平緩,但是夜間用電量比白天稍大,但是波動較小,可以看作不同于第二類的常規(guī)工作用戶。由圖可以看出K=4時的分類比K=3時效果更好。但在K=3結果下,我們得到的結論兩個分類結果組還需細致分類,在K=4時只把其中的一類繼續(xù)區(qū)分,而第一類用戶沒有得到更細致的分類。所以我們還需進行K=5時的仿真。4.2.4K=5時的仿真結果K=5時的仿真結果如下圖4.5所示。圖4.5K=5時分類結果由上圖4.5可以看出,經過K-means(K=5)聚類以后將31個用戶的日負荷曲線分為5類。第一類用戶的負荷曲線平緩,7到22時用電量較夜間小一些,此類用戶可看作正常上班族用戶。第二類用戶的用電高峰期在17時到23時,其余時間用電平緩,此類用戶可以看作為白天工作,夜晚回家以后導致用電量增加的上班族。第三類用戶在0到5時和20到23時(夜間)負荷較大,而在6到19時(白天)負荷較小,顯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級語文經典名著教學方案
- 內科護士培訓課程設置方案
- 零信任架構研究-第2篇-洞察及研究
- 量子光學信號放大與編碼-第1篇-洞察及研究
- 地磅基礎施工方案鉆施工方案
- 光伏發(fā)電系統(tǒng)屋面部署方案
- 隧道掘進通風系統(tǒng)施工方案
- 鋼結構屋面保溫方案
- 水泥攪拌樁地基處理組織方案
- 農田土地作業(yè)指導方案
- 《無人機地面站與任務規(guī)劃》 課件 第1-5章 概論 -無人機航測任務規(guī)劃與實施
- 綠色前綴5000畝生態(tài)農業(yè)示范園區(qū)建設規(guī)模及運營模式可行性研究報告
- DB42∕T 2078-2023 紅火蟻監(jiān)測與防控技術規(guī)程
- 2025-2030中醫(yī)養(yǎng)生培訓行業(yè)市場格局及增長趨勢與投資價值分析報告
- 污水處理廠管網調度與優(yōu)化方案
- 新能源汽車租賃服務在公務用車市場的應用與前景報告
- 《經濟博弈論》課后答案補充習題答案
- DB37∕T 4355-2021 淺海區(qū)海底重力測量技術規(guī)程
- 三輪摩托培訓知識大全課件
- 2025年哈鐵單招試題及答案
- 2025秋季學期國開電大法律事務專科《民法學(1)》期末紙質考試名詞解釋題庫珍藏版
評論
0/150
提交評論