風(fēng)電機(jī)組風(fēng)速_第1頁(yè)
風(fēng)電機(jī)組風(fēng)速_第2頁(yè)
風(fēng)電機(jī)組風(fēng)速_第3頁(yè)
風(fēng)電機(jī)組風(fēng)速_第4頁(yè)
風(fēng)電機(jī)組風(fēng)速_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

風(fēng)電機(jī)組風(fēng)速-功率異常運(yùn)行數(shù)據(jù)特征及清洗方法沈小軍;付雪姣;周沖成;王偉【摘要】風(fēng)功率曲線是考核風(fēng)電機(jī)組發(fā)電性能的重要指標(biāo),對(duì)風(fēng)電場(chǎng)的運(yùn)行管理和電力系統(tǒng)的運(yùn)行調(diào)度都具有重要意義.實(shí)際運(yùn)行過(guò)程的設(shè)備故障及人為控制因素會(huì)導(dǎo)致風(fēng)速-功率曲線中存在大量的異常數(shù)據(jù),給風(fēng)功率曲線的后續(xù)應(yīng)用帶來(lái)嚴(yán)重影響.本文在分析風(fēng)電機(jī)組風(fēng)速-功率異常運(yùn)行數(shù)據(jù)特征的基礎(chǔ)上,根據(jù)空間分布位置和形態(tài)將異常數(shù)據(jù)分為曲線底部、中部、上部堆積型異常數(shù)據(jù)和曲線周圍分散型異常數(shù)據(jù)等四類,提出了基于變點(diǎn)分組法與四分位法組合的異常數(shù)據(jù)識(shí)別清洗方法及流程,與四分位-變點(diǎn)分組法以及局部離群因子算法的對(duì)比算例驗(yàn)證結(jié)果表明,提出的交點(diǎn)分組-四分位法可有效識(shí)別四種類型的異常數(shù)據(jù),流程合理,清洗效果好,效率高,并具有較強(qiáng)的通用性.期刊名稱】《電工技術(shù)學(xué)報(bào)》年(卷),期】2018(033)014【總頁(yè)數(shù)】9頁(yè)(P3353-3361)【關(guān)鍵詞】風(fēng)電機(jī)組;風(fēng)功率曲線;異常數(shù)據(jù);數(shù)據(jù)清洗【作者】沈小軍;付雪姣;周沖成;王偉【作者單位】同濟(jì)大學(xué)電氣工程系上海200092;同濟(jì)大學(xué)電氣工程系上海200092;同濟(jì)大學(xué)電氣工程系上海200092;全球能源互聯(lián)網(wǎng)研究院北京102209【正文語(yǔ)種】中文中圖分類】TP274風(fēng)能是一種清潔、可再生的能源,正迅速成為可持續(xù)發(fā)展和能源戰(zhàn)略的重要組成部分[1,2]。但是風(fēng)力發(fā)電過(guò)程中隨機(jī)變化的風(fēng)速風(fēng)向使得風(fēng)電功率具有波動(dòng)性、間歇性和隨機(jī)性等特征,對(duì)電力系統(tǒng)運(yùn)行的穩(wěn)定性和可靠性造成不利影響[3-5]。消除這些不利影響的一種重要手段就是通過(guò)風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)的挖掘提高風(fēng)力發(fā)電的可預(yù)見(jiàn)性。通過(guò)實(shí)測(cè)風(fēng)速和功率得到的風(fēng)功率曲線可用于評(píng)估風(fēng)電機(jī)組的性能和運(yùn)行狀況,對(duì)判斷風(fēng)機(jī)故障有重要價(jià)值,同時(shí)時(shí)序功率數(shù)據(jù)也是研究風(fēng)電功率預(yù)測(cè)以及評(píng)估風(fēng)功率對(duì)電網(wǎng)影響的基礎(chǔ)[6]。因此,準(zhǔn)確獲得風(fēng)電機(jī)組實(shí)際運(yùn)行的風(fēng)速和功率數(shù)據(jù),能夠?yàn)轱L(fēng)電場(chǎng)的經(jīng)濟(jì)安全運(yùn)行和優(yōu)化控制策略提供根本的數(shù)據(jù)支撐。但是在風(fēng)電場(chǎng)運(yùn)行過(guò)程中,由于機(jī)組停機(jī)、減載、通信噪聲和設(shè)備故障等因素,會(huì)產(chǎn)生大量異常數(shù)據(jù)。目前風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)的收集、管理、分析和挖掘方法仍存在諸多不足,不能準(zhǔn)確辨識(shí)所采集數(shù)據(jù)的質(zhì)量差異,進(jìn)而有效支撐粗糙數(shù)據(jù)的正確篩選和合理化優(yōu)化,造成數(shù)據(jù)質(zhì)量得不到保障[7]。如果這些數(shù)據(jù)不經(jīng)處理直接使用,得到的風(fēng)力發(fā)電統(tǒng)計(jì)特性發(fā)生畸變,會(huì)影響風(fēng)電機(jī)組的運(yùn)行狀態(tài)和運(yùn)行特性的分析結(jié)果。為了提高數(shù)據(jù)質(zhì)量,數(shù)據(jù)清洗已成為數(shù)據(jù)挖掘過(guò)程中不可或缺的環(huán)節(jié)[8]。風(fēng)電機(jī)組異常運(yùn)行數(shù)據(jù)的識(shí)別與清洗是當(dāng)前的研究熱點(diǎn),已開(kāi)展大量工作并取得了諸多研究成果,其中風(fēng)電機(jī)組風(fēng)功率曲線數(shù)據(jù)清洗的代表性成果有:文獻(xiàn)[9]采用的四分位法是一種常用的異常數(shù)據(jù)識(shí)別方法,但是當(dāng)異常數(shù)據(jù)所占的比重較大時(shí),四分位法識(shí)別異常數(shù)據(jù)的效果變差;文獻(xiàn)[10]采用四分位法與k-means聯(lián)合算法剔除異常數(shù)據(jù),但由于k-means算法屬于分類算法,可能會(huì)導(dǎo)致正常數(shù)據(jù)的誤刪,且k值的確定比較復(fù)雜,對(duì)數(shù)據(jù)處理結(jié)果影響較大;文獻(xiàn)[11]采用組內(nèi)最優(yōu)方差算法實(shí)現(xiàn)了功率曲線下方的堆積型異常數(shù)據(jù)的有效識(shí)別效果,但該算法將每個(gè)風(fēng)速區(qū)間內(nèi)最大的功率默認(rèn)為風(fēng)機(jī)滿發(fā)功率,無(wú)法識(shí)別功率曲線上方的異常數(shù)據(jù);文獻(xiàn)[12]通過(guò)建立風(fēng)功率曲線的非線性模型實(shí)現(xiàn)異常數(shù)據(jù)的識(shí)別,該方法需要大量的正常數(shù)據(jù)作為樣本,否則訓(xùn)練誤差會(huì)較大,另外數(shù)據(jù)處理速度較慢;文獻(xiàn)[13]在假設(shè)風(fēng)功率的概率密度函數(shù)服從正態(tài)分布的基礎(chǔ)上,提出了基于3s法則的異常數(shù)據(jù)清洗方法,與實(shí)際風(fēng)電運(yùn)行數(shù)據(jù)中由于堆積型異常數(shù)據(jù)的存在風(fēng)功率的概率密度函數(shù)往往呈雙峰或多峰分布不符,其普適性及異常數(shù)據(jù)識(shí)別效果不好;文獻(xiàn)[14,15]采用基于密度的局部離群因子(LocalOutlierFactor,LOF)算法,把具有足夠高密度的區(qū)域劃分為簇,實(shí)現(xiàn)了分散型異常數(shù)據(jù)的有效識(shí)別,但不能有效識(shí)別密度較高的堆積型異常數(shù)據(jù)。綜上所述,當(dāng)前風(fēng)電機(jī)組風(fēng)速-功率運(yùn)行數(shù)據(jù)清洗方法從原理上可分為三類:第一類方法是根據(jù)數(shù)據(jù)點(diǎn)的密度或距離來(lái)判斷該點(diǎn)是否為異常點(diǎn),但該類方法對(duì)分布密集的堆積型異常數(shù)據(jù)識(shí)別效果有限;第二類方法是建立風(fēng)功率曲線的數(shù)學(xué)模型,但此類方法需要大量正常數(shù)據(jù)作為樣本,且普適性較差;第三類方法是根據(jù)異常數(shù)據(jù)的位置分布特征識(shí)別異常數(shù)據(jù),該類方法的依據(jù)是異常數(shù)據(jù)點(diǎn)位于風(fēng)功率曲線正常出力特性范圍之外,理論上可實(shí)現(xiàn)多類型異常數(shù)據(jù)的清洗,而且不需要數(shù)據(jù)樣本訓(xùn)練,通用性強(qiáng),后續(xù)應(yīng)用值得期待,但現(xiàn)有研究成果對(duì)大量堆積型異常數(shù)據(jù)的識(shí)別與清洗效果有待提高。另外,全面研究分析風(fēng)速-功率曲線異常數(shù)據(jù)的空間分布位置和形態(tài)對(duì)改進(jìn)該類方法識(shí)別清洗效果具有實(shí)際的指導(dǎo)意義,相關(guān)研究開(kāi)展得尚不系統(tǒng)。鑒于此,本文首先分析了風(fēng)電機(jī)組風(fēng)速-功率異常數(shù)據(jù)的分布特征及分類,然后根據(jù)異常數(shù)據(jù)分布特征提出一種基于變點(diǎn)分組與四分位法的聯(lián)合數(shù)據(jù)清洗算法和流程,最后從提出算法的有效性、流程的合理性及清洗效率等維度進(jìn)行了分析驗(yàn)證。風(fēng)功率曲線是描述風(fēng)速與機(jī)組輸出功率之間的關(guān)系曲線。它不僅是設(shè)計(jì)風(fēng)電機(jī)組控制系統(tǒng)的重要依據(jù),還是考核風(fēng)電機(jī)組發(fā)電性能和風(fēng)電場(chǎng)運(yùn)行狀況的重要指標(biāo)[10]從風(fēng)電場(chǎng)采集到的數(shù)據(jù)中通常包含大量異常數(shù)據(jù)點(diǎn)。導(dǎo)致數(shù)據(jù)異常的原因有很多,包括計(jì)劃外停機(jī)、棄風(fēng)限電、風(fēng)速傳感器失靈、通信設(shè)備故障、電磁干擾、風(fēng)機(jī)脫網(wǎng)、極端天氣情況、風(fēng)機(jī)葉片污垢或受損等因素。不同原因產(chǎn)生的異常數(shù)據(jù),在風(fēng)功率曲線上的分布特征也不相同。按照數(shù)據(jù)點(diǎn)在風(fēng)功率曲線上的分布特征,異常數(shù)據(jù)可分為四類,包括曲線底部、中部、上部堆積型異常數(shù)據(jù)和曲線周圍分散型異常數(shù)據(jù)。各類異常數(shù)據(jù)的分布如圖1所示。(1)曲線底部堆積型異常數(shù)據(jù)。曲線底部堆積型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為一條橫向密集數(shù)據(jù)帶。此類異常數(shù)據(jù)產(chǎn)生的原因包括機(jī)組故障、通信設(shè)備或測(cè)量終端故障、計(jì)劃外停機(jī)檢修等情況。在這些情況下,風(fēng)力發(fā)電機(jī)組的理論輸出功率均為零。若風(fēng)機(jī)葉片不轉(zhuǎn)動(dòng),而風(fēng)機(jī)的測(cè)控系統(tǒng)需要電力驅(qū)動(dòng),則數(shù)據(jù)中也可能出現(xiàn)風(fēng)電功率為負(fù)值的情況[14]。因此,曲線底部異常數(shù)據(jù)會(huì)在功率零值附近波動(dòng),表現(xiàn)為數(shù)據(jù)堆積。(2)曲線中部堆積型異常數(shù)據(jù)。曲線中部堆積型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為一條或多條位于概率功率曲線下界之外的橫向密集數(shù)據(jù)帶。此類異常數(shù)據(jù)產(chǎn)生的原因是棄風(fēng)限電或通信故障。棄風(fēng)限電是指限制風(fēng)電機(jī)組的輸出功率,使其低于正常出力的控制措施。在風(fēng)電場(chǎng)的實(shí)際運(yùn)行過(guò)程中,由于目前電力系統(tǒng)的調(diào)峰調(diào)頻能力和輸電能力不足,強(qiáng)制棄風(fēng)已成為常態(tài)[16],這就使得原始記錄數(shù)據(jù)中會(huì)存在大量的異常數(shù)據(jù)。在實(shí)際運(yùn)行中,由于許多數(shù)據(jù)集沒(méi)有記錄棄風(fēng)措施的信息,因此本文將棄風(fēng)限電作為異常數(shù)據(jù)的來(lái)源之一。在這種情況下,風(fēng)速數(shù)據(jù)記錄的是實(shí)際變化情況,而風(fēng)電機(jī)組的輸出功率長(zhǎng)期維持在一個(gè)較低的水平保持不變,即使風(fēng)速超過(guò)額定風(fēng)速,輸出功率也長(zhǎng)期低于滿發(fā)狀態(tài),限定在某一個(gè)值。因此,曲線中部異常數(shù)據(jù)會(huì)在較大風(fēng)速范圍內(nèi)維持在低于滿發(fā)的狀態(tài)保持不變,表現(xiàn)為數(shù)據(jù)堆積。(3)曲線上部堆積型異常數(shù)據(jù)。曲線上部堆積型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為一條或多條位于概率功率曲線上界之外的橫向密集數(shù)據(jù)帶。此類異常數(shù)據(jù)產(chǎn)生的原因通常是通信錯(cuò)誤[17]或風(fēng)速傳感器失靈。風(fēng)速傳感器是監(jiān)測(cè)風(fēng)速的重要儀表,安裝在發(fā)電機(jī)組機(jī)艙尾部,難以時(shí)常清洗和維護(hù),常出現(xiàn)故障或卡滯現(xiàn)象,導(dǎo)致測(cè)量的風(fēng)速數(shù)據(jù)不符合實(shí)際情況。曲線上部堆積型異常數(shù)據(jù)會(huì)在低風(fēng)速調(diào)度時(shí)段內(nèi)保持功率不變,表現(xiàn)為數(shù)據(jù)堆積。曲線周圍分散型異常數(shù)據(jù)。曲線周圍分散型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為功率曲線附近密度較低的無(wú)規(guī)律散點(diǎn)。此類異常數(shù)據(jù)是由信號(hào)傳播噪聲、傳感器失靈、極端天氣情況等隨機(jī)影響因素造成的。隨機(jī)因素造成的異常數(shù)據(jù)會(huì)在正常值附近隨機(jī)波動(dòng),波動(dòng)程度的大小也是隨機(jī)的。因此,曲線周圍分散型異常數(shù)據(jù)會(huì)在概率功率曲線邊界之外隨機(jī)分散分布。根據(jù)上述四類異常數(shù)據(jù)的分布特征和產(chǎn)生原因可知,堆積型異常數(shù)據(jù)通常是由于無(wú)法瞬時(shí)恢復(fù)的故障或異常狀態(tài)產(chǎn)生的,例如,通信設(shè)備故障、計(jì)劃外的停機(jī)檢修、強(qiáng)制棄風(fēng)和風(fēng)機(jī)葉片損壞等。由于這些故障或異常狀態(tài)難以在短時(shí)間內(nèi)恢復(fù),因此該類異常數(shù)據(jù)在集中的一段時(shí)間內(nèi)連續(xù)產(chǎn)生,具有量多且分布集中的特征。分散型異常數(shù)據(jù)則一般是由可短時(shí)間內(nèi)恢復(fù)的故障或異常狀態(tài)造成的,如通信噪聲或極端天氣狀況等。這些因素是隨機(jī)產(chǎn)生且變化的,因此該類異常數(shù)據(jù)具有隨機(jī)性和不確定性,表現(xiàn)為分散分布的形態(tài)。變點(diǎn)(change-point)問(wèn)題最早在工業(yè)質(zhì)量控制中發(fā)揮了巨大的作用,經(jīng)過(guò)幾十年的發(fā)展,變點(diǎn)分析在醫(yī)學(xué)研究、地理科學(xué)、信號(hào)過(guò)程和經(jīng)濟(jì)金融等領(lǐng)域都有十分廣泛的應(yīng)用[18,19]。變點(diǎn)是指在一個(gè)序列或過(guò)程中的某個(gè)或某些量突然變化的點(diǎn),這種突然變化往往反映數(shù)據(jù)的某種質(zhì)的變化[20]。在數(shù)理統(tǒng)計(jì)中,堆積型異常數(shù)據(jù)的分布特征是數(shù)據(jù)量多且分布集中,受異常數(shù)據(jù)的影響,序列的均值、方差或變化率等統(tǒng)計(jì)特性均會(huì)發(fā)生變化[21]。因此,采用變點(diǎn)分析對(duì)風(fēng)功率曲線中的異常數(shù)據(jù)進(jìn)行清洗具有理論可行性。變點(diǎn)問(wèn)題根據(jù)變點(diǎn)處的變化形式主要分為突變和漸變問(wèn)題,根據(jù)分布的均值和方差等主要數(shù)字特征的變化,分為位置參數(shù)和刻度參數(shù)變點(diǎn)問(wèn)題。在研究數(shù)據(jù)清洗問(wèn)題時(shí),研究的是風(fēng)功率序列中數(shù)據(jù)特征突變的位置參數(shù)。通過(guò)研究發(fā)現(xiàn),如果一個(gè)風(fēng)速區(qū)間內(nèi)存在堆積型異常數(shù)據(jù),功率序列的變化率、均值、方差以及方差的變化率等數(shù)據(jù)的特征都會(huì)發(fā)生突變。以方差的變化率作為變點(diǎn)分組依據(jù)時(shí),數(shù)據(jù)清洗效果最好,數(shù)據(jù)損失量最少,因此本文采用方差變化率的變點(diǎn)作為分組依據(jù)?;诜讲钭兓实淖凕c(diǎn)分組法具體如下:記某一風(fēng)速區(qū)間內(nèi)的數(shù)據(jù)樣本集合為式中,Vi和pi分別表示第i個(gè)數(shù)據(jù)樣本的風(fēng)速和功率,且數(shù)據(jù)按照功率值降序排列,即令。求出各點(diǎn)方差為式中,si為第i個(gè)點(diǎn)的方差;pj為第j個(gè)點(diǎn)的功率值;為第1~i個(gè)點(diǎn)的功率的平均值。這樣si可以衡量pi與該點(diǎn)之前所有數(shù)據(jù)的離散程度。得到各點(diǎn)的方差后,通過(guò)方差的變化率k(i)來(lái)觀察方差變化是否明顯。令對(duì)風(fēng)機(jī)功率的方差變化率進(jìn)行變點(diǎn)識(shí)別,可以從統(tǒng)計(jì)學(xué)的角度得到功率值明顯變化的位置。變點(diǎn)檢測(cè)的方法經(jīng)過(guò)幾十年的發(fā)展不斷完善,包括Bayes方法、最小二乘法、極大似然法、局部比較法和小波分析法等。最小二乘法是處理變點(diǎn)問(wèn)題時(shí)使用較多的一種方法,以觀察值與理論值之差的二次方和作為目標(biāo)函數(shù),以其達(dá)到極小值之點(diǎn)的時(shí)刻或位置作為有關(guān)參數(shù)的估計(jì)[22],其優(yōu)點(diǎn)是對(duì)隨機(jī)誤差的分布不需要作特定的假設(shè)。此處采用最小二乘法對(duì)方差變化率k(i)進(jìn)行變點(diǎn)識(shí)別。設(shè)有自變量x1,...,xr和因變量k均為變量i的函數(shù),記為xq(i),q=1,...,r和k(i)。xq(i)是i的完全已知非隨機(jī)函數(shù),k(i)為隨機(jī)變量,分為前后兩段,兩段各服從一線性模型,回歸系數(shù)在i=j處發(fā)生突變,即式中,系數(shù)列向量和不相等,則j為回歸變點(diǎn)。由于k(i)是連續(xù)的,因此有約束條件根據(jù)最小二乘法的原理,此數(shù)據(jù)樣本模型的加權(quán)目標(biāo)函數(shù)為式中,各項(xiàng)的權(quán)wi與樣本k(i)的誤差方差成反比。求在約束式(5)之下式(6)的極小值,以確定變點(diǎn)j的估計(jì)[23]求出變點(diǎn)j后,變點(diǎn)之后的數(shù)據(jù)離散程度越來(lái)越高,可以作為異常數(shù)據(jù)刪除,因而可以將數(shù)據(jù)劃分為正常數(shù)據(jù)和異常數(shù)據(jù)兩部分,即式中,Wn為該風(fēng)速區(qū)間的正常數(shù)據(jù)集;Wo為該風(fēng)速區(qū)間的異常數(shù)據(jù)集。對(duì)其他風(fēng)速區(qū)間進(jìn)行相同處理,即可得到風(fēng)電機(jī)組整個(gè)風(fēng)速區(qū)間的功率曲線正常數(shù)據(jù)集和異常數(shù)據(jù)集。下面以某臺(tái)風(fēng)電機(jī)組的實(shí)測(cè)運(yùn)行數(shù)據(jù)中選取8.5~9m/s風(fēng)速段數(shù)據(jù)為例展示方差變化率變點(diǎn)分組法的工作過(guò)程。經(jīng)統(tǒng)計(jì),原始數(shù)據(jù)在該風(fēng)速區(qū)間共有1837個(gè)數(shù)據(jù)組。按照功率值對(duì)數(shù)據(jù)進(jìn)行降序排列,使其滿足。根據(jù)式(2)依次計(jì)算1837組數(shù)據(jù)功率的方差si,然后求出各點(diǎn)的方差變化率k(i),如圖2所示。由圖2可知,在第1500-1600個(gè)點(diǎn)之間,方差變化率出現(xiàn)了顯著變化。通過(guò)最小二乘法變點(diǎn)識(shí)別可以求出,序列的變點(diǎn)j=1562,即在第1562個(gè)點(diǎn),曲線模型發(fā)生了突變。方差變化率的突變,是由于原始數(shù)據(jù)中存在大量離散程度高的異常數(shù)據(jù)所致,因此可以判定第1562個(gè)點(diǎn)之后的數(shù)據(jù)為異常數(shù)據(jù)。根據(jù)變點(diǎn)j將正常數(shù)據(jù)和異常數(shù)據(jù)分離,得到正常數(shù)據(jù)集Wn和異常數(shù)據(jù)Wo。圖3是變點(diǎn)分組法對(duì)8.5~9m/s風(fēng)速段數(shù)據(jù)中異常數(shù)據(jù)的識(shí)別效果。由圖3可知,變點(diǎn)分組法準(zhǔn)確識(shí)別出了風(fēng)速-功率曲線下方的第一、二類堆積型異常數(shù)據(jù)和部分分散型異常數(shù)據(jù),但是對(duì)風(fēng)功率曲線上界的第三類堆積型異常數(shù)據(jù)和部分分散型異常數(shù)據(jù)無(wú)法有效識(shí)別。四分位數(shù)及其上、下邊界可以衡量數(shù)據(jù)的整體分布情況,反映數(shù)據(jù)分布的中心位置和分散范圍,理論上利用四分位法中的異常值截?cái)帱c(diǎn)可有效識(shí)別剩余的異常數(shù)據(jù)。四分位數(shù)(Quartile)是指將一個(gè)排好序的數(shù)據(jù)樣本平均劃分成四部分的處于三個(gè)分割點(diǎn)位置的數(shù)值,分別記作Q1、Q2、Q3。四分位數(shù)的計(jì)算方法有很多,對(duì)于一個(gè)按照升序排列的樣本,四分位數(shù)計(jì)算方法如下[7]。(1)計(jì)算第2個(gè)四分位數(shù),即中位數(shù)Q2為(2)計(jì)算第1和第3個(gè)四分位數(shù)Q1和Q3。當(dāng)n=2k()時(shí),從Q2處將數(shù)據(jù)樣本X分為兩部分,Q2不包含在兩部分?jǐn)?shù)據(jù)之內(nèi),分別按式(9)計(jì)算兩部分的中位數(shù)和(v,則Q1二,Q2=。當(dāng)n=4k+1時(shí),有當(dāng)n=4k+3時(shí),有通過(guò)四分位數(shù)可得到四分位距(InterQuartileRange,IQR),用IQR表示為根據(jù)四分位距IQR可以確定數(shù)據(jù)樣本X中的異常值的內(nèi)限為處于內(nèi)限以外的數(shù)據(jù)都被判定為異常值。四分位法對(duì)圖3中剩余的異常數(shù)據(jù)清洗效果如圖4所示,變點(diǎn)分組法無(wú)法識(shí)別的第三類堆積型異常數(shù)據(jù)和部分分散型異常數(shù)據(jù)通過(guò)四分位法實(shí)現(xiàn)有效識(shí)別清洗,可見(jiàn),聯(lián)合變點(diǎn)分組法和四分位法可較好地識(shí)別四類典型異常數(shù)據(jù)。從2.1節(jié)和2.2節(jié)的結(jié)果表明,聯(lián)合變點(diǎn)分組法和四分位法可有效實(shí)現(xiàn)風(fēng)電機(jī)組風(fēng)速-功率曲線異常數(shù)據(jù)的識(shí)別清洗。理論上變點(diǎn)分組法和四分位法的聯(lián)合存在變點(diǎn)分組-四分位和四分位-變點(diǎn)分組兩組基本組合方式。但分析風(fēng)電機(jī)組的實(shí)際運(yùn)行狀況發(fā)現(xiàn),風(fēng)速-功率運(yùn)行數(shù)據(jù)中堆積型異常數(shù)據(jù)出現(xiàn)的頻率較高,且第一、二類堆積型異常數(shù)據(jù)居多。若首先應(yīng)用四分位法進(jìn)行原始異常數(shù)據(jù)識(shí)別清洗,四分位法的異常值內(nèi)限容易受到大量堆積型異常數(shù)據(jù)的影響,特別是正常數(shù)據(jù)與異常數(shù)據(jù)的數(shù)量相當(dāng)時(shí),會(huì)出現(xiàn)完全無(wú)法識(shí)別異常數(shù)據(jù)的現(xiàn)象,影響總體的異常數(shù)據(jù)識(shí)別效果。而采用變點(diǎn)分組-四分位法可有效避免上述缺陷,因?yàn)樽凕c(diǎn)估計(jì)不受堆積型異常數(shù)據(jù)的影響,首先使用變點(diǎn)分組法可有效剔除第一、二類堆積型異常數(shù)據(jù),減少異常數(shù)據(jù)量,在一定程度上克服四分位法在異常數(shù)據(jù)較多時(shí)易發(fā)生失效的缺陷??梢?jiàn),采用變點(diǎn)分組-四分位的組合理論上具有更好的異常數(shù)據(jù)辨識(shí)效果:首先采用變點(diǎn)分組法識(shí)別風(fēng)速-功率數(shù)據(jù)集中第一、二類堆積型異常數(shù)據(jù)和部分第四類分散型異常數(shù)據(jù),然后采用四分位法識(shí)別第三類堆積型異常數(shù)據(jù)和剩余的第四類分散型異常數(shù)據(jù),具體數(shù)據(jù)清洗流程如圖5所示。為了驗(yàn)證所提數(shù)據(jù)清洗方法及流程的有效性,選取國(guó)內(nèi)某風(fēng)電場(chǎng)風(fēng)電機(jī)組的運(yùn)行數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證,該風(fēng)電場(chǎng)風(fēng)電機(jī)組的基本參數(shù)如下:額定功率2OOOkW,風(fēng)輪直徑95.9m,切入風(fēng)速3m/s,額定風(fēng)速11m/s,切出風(fēng)速(10min平均值)25m/s。這里選取異常數(shù)據(jù)分布比較典型的1號(hào)機(jī)組、2號(hào)機(jī)組和7號(hào)機(jī)組的運(yùn)行數(shù)據(jù)來(lái)說(shuō)明聯(lián)合算法對(duì)數(shù)據(jù)的清洗效果。1號(hào)機(jī)組、2號(hào)機(jī)組和7號(hào)機(jī)組連續(xù)12個(gè)月的原始數(shù)據(jù)如圖6所示。由圖6可知,1號(hào)機(jī)組的數(shù)據(jù)中包含第一、二、四類異常數(shù)據(jù),2號(hào)機(jī)組和7號(hào)機(jī)組含有所有類型異常數(shù)據(jù),但具體的分布位置及數(shù)量不同。變點(diǎn)分組-四分位法對(duì)三個(gè)機(jī)組的異常數(shù)據(jù)識(shí)別結(jié)果如圖7所示。由圖7可知,三個(gè)風(fēng)電機(jī)組中所包含的所有類型異常數(shù)據(jù)都能被有效識(shí)別,且圖中被判定為正常數(shù)據(jù)的部分接近理想狀態(tài)的風(fēng)功率曲線,說(shuō)明本文提出的變點(diǎn)分組-四分位法對(duì)風(fēng)電機(jī)組風(fēng)速-功率異常運(yùn)行數(shù)據(jù)的識(shí)別清洗是可行的,且清洗效果不受堆積型異常數(shù)據(jù)的影響。三個(gè)風(fēng)電機(jī)組中所包含的異常數(shù)據(jù)類型不同,但數(shù)據(jù)清洗效果相似,不受實(shí)際異常數(shù)據(jù)類型及數(shù)量的影響,說(shuō)明此方法具有一定的通用性。表1中記錄了變點(diǎn)分組-四分位法對(duì)三個(gè)機(jī)組的數(shù)據(jù)刪除率和清洗效率。此方法對(duì)異常數(shù)據(jù)的刪除率均在20%左右,這與異常數(shù)據(jù)的多少有關(guān)。三個(gè)機(jī)組12個(gè)月的運(yùn)行數(shù)據(jù)清洗耗時(shí)在40s左右,清洗效率較高。為了說(shuō)明變點(diǎn)分組-四分位法這一數(shù)據(jù)清洗流程的合理性和有效性,文中利用7號(hào)機(jī)組的原始運(yùn)行數(shù)據(jù)從清洗效果、清洗效率以及數(shù)據(jù)刪除率等維度對(duì)比分析了提出的方法與四分位-變點(diǎn)分組法及傳統(tǒng)的局部離群因子(LocalOutlierFactor,LOF)數(shù)據(jù)清洗方法。表1從數(shù)據(jù)刪除率和清洗效率兩個(gè)角度對(duì)三種方法對(duì)比結(jié)果。其中,清洗效率均是在相同的運(yùn)行環(huán)境下得到的,因此具有一定的可比性。采用四分位-變點(diǎn)分組法對(duì)7號(hào)機(jī)組的數(shù)據(jù)清洗效果如圖8所示。對(duì)比圖8和圖7c可知,將變點(diǎn)分組和四分位法的順序?qū)φ{(diào),18m/s附近風(fēng)速區(qū)間的異常數(shù)據(jù)不能完全識(shí)別。結(jié)合表1和圖7,可得1號(hào)、2號(hào)和7號(hào)機(jī)組的運(yùn)行數(shù)據(jù)中異常數(shù)據(jù)所占的比例分別不會(huì)超過(guò)21.65%,19.06%和21.04%。但四分位-變點(diǎn)分組法對(duì)這三個(gè)機(jī)組的數(shù)據(jù)刪除率分別高達(dá)24.06%、22.51%和27.10%,這說(shuō)明有正常數(shù)據(jù)被錯(cuò)誤識(shí)別為異常數(shù)據(jù)。雖然四分位-變點(diǎn)分組法的效率稍高,但此方法正常數(shù)據(jù)損失率偏高,會(huì)對(duì)數(shù)據(jù)的完整度造成不利影響,更主要的是不能完全識(shí)別清除所有異常數(shù)據(jù)。使用LOF算法清洗7號(hào)機(jī)組運(yùn)行數(shù)據(jù)的效果如圖9所示。LOF算法是一種典型的聚類算法,通過(guò)比較每個(gè)點(diǎn)和其鄰域點(diǎn)的密度來(lái)判斷該點(diǎn)是否為異常點(diǎn),本文中選擇的鄰域點(diǎn)的個(gè)數(shù)為20。LOF算法中,異常數(shù)據(jù)所占的比例需要提前設(shè)定,為了便于和變點(diǎn)分組-四分位法進(jìn)行比較,將所有數(shù)據(jù)點(diǎn)中前21.04%的局部離群因子最高的點(diǎn)判定為異常值,使之與變點(diǎn)分組-四分位法識(shí)別的異常數(shù)據(jù)量相同。對(duì)比圖7c和圖9可以看出,當(dāng)兩種方法識(shí)別的異常數(shù)據(jù)量相同時(shí),LOF算法對(duì)堆積型異常數(shù)據(jù)的識(shí)別效果不佳。綜上所述,變點(diǎn)分組-四分位法為風(fēng)電機(jī)組風(fēng)速-功率運(yùn)行數(shù)據(jù)的清洗提供了高效、合理、可靠的方法。變點(diǎn)分組-四分位法能實(shí)現(xiàn)對(duì)風(fēng)功率曲線中堆積型異常數(shù)據(jù)和分散型異常數(shù)據(jù)的有效識(shí)別,可滿足不同機(jī)組、不同異常數(shù)據(jù)分布狀況的清洗需求,特別是當(dāng)機(jī)組的風(fēng)速-功率數(shù)據(jù)中存在大量第一、二類堆積型異常數(shù)據(jù)時(shí)具有明顯的優(yōu)勢(shì)。異常數(shù)據(jù)識(shí)別清洗效果及效率不僅與清洗方法有關(guān),還與清洗的順序相關(guān),應(yīng)引起注意。通過(guò)對(duì)風(fēng)電運(yùn)行數(shù)據(jù)的清洗,可以提高風(fēng)功率預(yù)測(cè)和風(fēng)電場(chǎng)相關(guān)性等效建模的質(zhì)量,為風(fēng)電場(chǎng)的經(jīng)濟(jì)安全運(yùn)行和優(yōu)化控制策略提供根本的數(shù)據(jù)支撐。風(fēng)電機(jī)組風(fēng)速-功率異常數(shù)據(jù)會(huì)對(duì)風(fēng)電數(shù)據(jù)挖掘帶來(lái)負(fù)面影響。本文總結(jié)了風(fēng)電機(jī)組風(fēng)速-功率異常數(shù)據(jù)的分布特征,提出并建立了變點(diǎn)分組-四分位法數(shù)據(jù)清洗方法及流程。實(shí)例驗(yàn)證表明,所提的數(shù)據(jù)清洗方法及流程能夠有效識(shí)別異常數(shù)據(jù),效率較高,且不依賴于正常數(shù)據(jù)集進(jìn)行訓(xùn)練,通用性較好。沈小軍男,1979年生,博士,副教授,研究方向?yàn)樾履茉锤咝Ю门c節(jié)能技術(shù)電網(wǎng)實(shí)景三維重構(gòu)及其應(yīng)用、電力設(shè)備狀態(tài)評(píng)估等。E-mail:(通信作者)付雪姣女,1993年生,碩士研究生,研究方向?yàn)樾履茉锤咝Ю门c節(jié)能技術(shù)。E-mail:【相關(guān)文獻(xiàn)】GeShen,BinXu,YunxianJing,etal.Monitoringwindfarmsoccupyinggrasslandsbasedonremote-sensingdatafromChina'sGF-2HDsatellite—AcasestudyofJiuquancity,Gansuprovince,China[J].Resources,ConservationandRecycling,2017,12(1):128136.田中大,李樹(shù)江,王艷紅,等.基于小波變換的風(fēng)電場(chǎng)短期風(fēng)速組合預(yù)測(cè)[J].電工技術(shù)學(xué)報(bào),2015,30(9):112-120.TianZhongda,LiShujiang,WangYanhong,etal.Short-termwindspeedcombinedpredictionforwindfarmsbasedonwavelettransform[J].TransactionsofChinaElectrotechnicalSociety,2015,30(9):112-120.韋姝,魏海坤,朱婷婷,等.考慮風(fēng)速分布與日非平穩(wěn)性的風(fēng)速數(shù)據(jù)預(yù)處理方法研究[J].電網(wǎng)與清潔能源,2015,31(3):93-98,123.WeiShu,WeiHaikun,ZhuTingting,etal.Researchondatapre-processingmethodconsideringdistri-butionanddiurnalnon-stationaryofwindspeed[J].PowerSystemandCleanEnergy,2015,31(3):93-98,123.郭鵬,文晶,朱丹丹,等.基于源-荷互動(dòng)的大規(guī)模風(fēng)電消納協(xié)調(diào)控制策略[J].電工技術(shù)學(xué)報(bào),2017,32(3):1-9.GuoPeng,WenJing,ZhuDandan,etal.Thecoor-dinationcontrolstrategyforlarge-scalewindpowerconsumptionbasedonsource-loadinteractive[J].TransactionsofChinaElectrotechnicalSociety,2017,32(3):1-9.孫欣,方陳,沈風(fēng),等.考慮風(fēng)電出力不確定性的發(fā)用電機(jī)組組合方法[J].電工技術(shù)學(xué)報(bào),2017,32(4):204-211.SunXin,FangChen,ShenFeng,etal.Anintegratedgeneration-consumptionunitcommitmentmodelconsideringtheuncertaintyofwindpower[J].Transa-ctionsofChinaElectrotechnicalSociety,2017,32(4):204-211.⑹ 楊茂,熊昊,嚴(yán)干貴,等.基于數(shù)據(jù)挖掘和模糊聚類的風(fēng)電功率實(shí)時(shí)預(yù)測(cè)研究[J].電力系統(tǒng)保護(hù)與控制,2013,41(1):1-6.YangMao,XiongHao,YanGangui,etal.Real-timepredictionofwindpowerbasedondataminingandfuzzyclustering[J].PowerSystemProtectionandControl,2013,41(1):1-6.王欽,蔣懷光,文福拴,等?智能電網(wǎng)中大數(shù)據(jù)的概念、技術(shù)與挑戰(zhàn)J].電力建設(shè),2016,37(12):1-10.WangQin,JiangHuaiguang,WenFushuan,etal.Concept,technologyandchallengesofbigdatainsmartgrids[J].ElectricPowerConstruction,2016,37(12):1-10.SwapnaS,NiranjanP,SrinivasB,etal.Datacleaningfordataquality[C]//IEEEInternationalConferenceonComputingforSustainableGlobalDevelopment,NewDelhi,India,2016.朱倩雯,葉林,趙永寧,等.風(fēng)電場(chǎng)輸出功率異常數(shù)據(jù)識(shí)別與重構(gòu)方法研究[J].電力系統(tǒng)保護(hù)與控制,2015,43(3):38-45.ZhuQianwen,YeLin,ZhaoYongning,etal.Methodsforeliminationandreconstructionofabnormalpowerdatainwindfarms[J].PowerSystemProtectionandControl,2015,43(3):38-45.趙永寧,葉林,朱倩雯?風(fēng)電場(chǎng)棄風(fēng)異常數(shù)據(jù)簇的特征及處理方法J]?電力系統(tǒng)自動(dòng)化,2014,38(27):39-46.ZhaoYongning,YeLin,ZhuQianwen.Characteri-sticsandprocessingmethodofabnormaldataclustercausedbywindcurtailmentsinwindfarms[J].AutomationofElectricPowerSystems,2014,38(27):39-46.婁建樓,胥佳,陸恒,等.基于功率曲線的風(fēng)電機(jī)組數(shù)據(jù)清洗算法[J].電力系統(tǒng)自動(dòng)化,2016,40(10):116-121.LouJianlou,XuJia,LuHeng,etal.Windturbinedata-cleaningalgorithmbasedonpowercurve[J].AutomationofElectricPowerSystems,2016,40(10):116-121.AndrewKusiak,SongHaiyang,SongZhe.Modlesformonitoringwindfarmpower[J].RenewableEnergy,2009,34(3):583-590.YueWang,DavidGInfield,BruceStephen,etal.Copula-basedmodelforwindturbinepowercurveoutlierrejection[J].WindEnergy,2014,17(11):1677-1688.范曉泉,杜大軍,費(fèi)敏銳.風(fēng)電異常測(cè)量數(shù)據(jù)智能識(shí)別方法研究[J].儀表技術(shù),2017(1):10-14.FanXiaoquan,DuDajun,FeiMinrui.Researchontheintelligentidentificationmethodforabnormalmeasurementdataofthewindpower[J].Instru-mentationTechnology,2017(1):10-14.ZhengL,HuW,MinY.Rawwinddatapreprocessing:adata-miningapproach[J].IEEETransactionsonSustainableEnergy,2014,6(1):11-19.田書(shū)欣,程浩忠,曾平良,等.基于調(diào)頻層面的風(fēng)電棄風(fēng)分析[J].電工技術(shù)學(xué)報(bào),2015,30(7):18-26.TianShuxin,ChengHaozhong,ZengPingliang,etal.Analysisonwindpowercurtailmentatfrequencyadjustmentlevel[J].TransactionsofChinaElectro-technicalSocie

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論