版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1華北電力大學(xué)2025年9月25日凡航,現(xiàn)任華北電力大學(xué)經(jīng)濟(jì)與管理學(xué)院講師,碩士生導(dǎo)師,中國電機(jī)工程學(xué)會(huì)第十屆青年托舉人才,清華大學(xué)電氣工程專業(yè)博士,清華大學(xué)五道口金融學(xué)院和交叉信息研究院聯(lián)合培養(yǎng)博士后,特許金融分析師(CFA)持證人。長期從事電氣工程、人工智能和金融相關(guān)的交叉研究,主持和參與電網(wǎng)與人工智能類科技項(xiàng)目10余項(xiàng),發(fā)表/錄用SCI/EI和核心期刊論文30余篇,已授權(quán)發(fā)明專利8項(xiàng),參與撰寫數(shù)據(jù)經(jīng)濟(jì)方面的專著1本,曾獲得全國人工智能應(yīng)用場景創(chuàng)新挑戰(zhàn)賽二等獎(jiǎng)、國網(wǎng)上海市電力公司科技進(jìn)步二等獎(jiǎng)、國家獎(jiǎng)學(xué)金和清華大學(xué)數(shù)據(jù)科學(xué)特等獎(jiǎng)學(xué)金等榮譽(yù)。三、面向零樣本風(fēng)電功率預(yù)測的基座模型3隨著“雙碳”目標(biāo)的逐步落實(shí),我國新能源飛速發(fā)展,裝機(jī)規(guī)模連續(xù)多年穩(wěn)居世界第一。截至2024年底,我國風(fēng)電、太陽能發(fā)電裝機(jī)合計(jì)達(dá)到了14.1億千瓦,占總發(fā)電裝機(jī)的比重超過40%,提前6年完成我國承諾的“到2030年中國風(fēng)電、太陽能發(fā)電總裝機(jī)容量達(dá)到12億千瓦以上”目標(biāo)。ofpowersources0■2014-2024年我國新能源發(fā)電量及占比華北電力大學(xué)華北電力大學(xué)新型電力系統(tǒng)隨著大規(guī)模新能源電力接入電網(wǎng),電力系統(tǒng)需要在隨機(jī)波動(dòng)的負(fù)荷需求與隨機(jī)波動(dòng)的電源之間實(shí)現(xiàn)能量的供需平衡,其結(jié)構(gòu)形態(tài)、運(yùn)行控制方式以及規(guī)劃建設(shè)與管理將發(fā)生根本性變革,形成以新能源電力生產(chǎn)、傳輸、消費(fèi)為主體的新一代電力系統(tǒng),即以新能源為主體的新型電力系統(tǒng)。發(fā)電相對(duì)確定、可控強(qiáng)隨機(jī)波動(dòng)性強(qiáng)隨機(jī)波動(dòng)性隨著新型電力系統(tǒng)結(jié)構(gòu)日益復(fù)雜風(fēng)電、光伏、負(fù)荷、電價(jià)等多個(gè)場景波動(dòng)性日益增加,亟需新一代預(yù)測方法研究。生成式人工智能,特別是大模型技術(shù)的興分布式數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)驅(qū)動(dòng)的電電集中式集中式+網(wǎng)竺網(wǎng)竺⑧新型主體廣泛接入罐群罐群跨域跨模態(tài)融合華北電力大學(xué)華北電力大學(xué)傳統(tǒng)預(yù)測方法·僅考慮待預(yù)測目標(biāo)風(fēng)電場的數(shù)據(jù)信息,·利用的信息維度單一,僅利用時(shí)序數(shù)據(jù)信息,無法充分利用文本等跨模態(tài)信息研究動(dòng)機(jī)·融合文本、時(shí)序數(shù)值等多模態(tài)數(shù)據(jù),利用大語·通過自然語言提示(Prompt)等方式,模型不僅能學(xué)習(xí)數(shù)據(jù)中的相關(guān)性,更能理解預(yù)測任務(wù)的“語義”,超越了單純的數(shù)值擬合。華北電力大學(xué)華北電力大學(xué)當(dāng)前任務(wù)問題預(yù)測任務(wù)復(fù)雜:單個(gè)場站、多個(gè)場站、場站集群…傳統(tǒng)方法通常為每一個(gè)風(fēng)電場或集群單獨(dú)訓(xùn)練一個(gè)預(yù)測模型。核心弊端·傳統(tǒng)上需要為每一種預(yù)測任務(wù)單獨(dú)設(shè)計(jì)和訓(xùn)練一個(gè)專用模型,導(dǎo)致研發(fā)工作量呈指·不同任務(wù)的模型之間無法共享信息,忽視了這些任務(wù)背后共通的物理關(guān)聯(lián)。研究動(dòng)機(jī)我們能否開發(fā)一個(gè)統(tǒng)一的框架,既能打破風(fēng)場間壁壘,又能整合多樣的預(yù)測任務(wù)?·采用多任務(wù)學(xué)習(xí)與基座模型框架,實(shí)現(xiàn)對(duì)區(qū)域內(nèi)所有風(fēng)電場的統(tǒng)一建模與同步預(yù)測。這類方法能夠通過一個(gè)模型對(duì)風(fēng)電場進(jìn)行多時(shí)間尺度·通過在海量多站點(diǎn)數(shù)據(jù)上預(yù)訓(xùn)練,模型學(xué)習(xí)廣域范圍內(nèi)的普遍物理規(guī)律,打破單一風(fēng)場的限制,實(shí)現(xiàn)新建風(fēng)電場的零樣本學(xué)習(xí)。一、研究背景及意義9M2WLLM是一個(gè)創(chuàng)新的多模態(tài)融合預(yù)測模型,其核心在于通過整合文本信息與時(shí)序數(shù)值數(shù)據(jù),充分利用LLM強(qiáng)大的預(yù)訓(xùn)練能力來進(jìn)行預(yù)測。模型接收兩種輸入:一是精心設(shè)計(jì)的自然語言提示詞(Prompts),為模在處理流程上,模型采用雙路嵌入機(jī)制:提示詞嵌入器直接利用LLM的詞嵌入層處理文本,而數(shù)據(jù)嵌入器則作為關(guān)鍵橋梁,專門處理數(shù)值時(shí)間序列。兩者生成的向量被拼接后,輸入到經(jīng)過LoRA參數(shù)高效微調(diào)的LLM骨干網(wǎng)絡(luò)中,進(jìn)行深度的特征提取與時(shí)序建模。最后,LLM的輸出經(jīng)過一個(gè)線性層,將高維特征映射為最終的多步風(fēng)電功率預(yù)測值。PromptEmbeder_HangFan,MingxuanLi,ZuMulti-modalmulti-taskultra-short-termwindpowerpredictionalgorithmbasedonlargemodel,InformationFusion,126,PartA,103541,2026,mM窗華北電力大學(xué)面臨的挑戰(zhàn)解決方案V通過結(jié)構(gòu)化的自然語言提示詞,將純粹的數(shù)值預(yù)測問題,轉(zhuǎn)化為LLM更擅長的、帶有豐富上“高氣壓”等描述性語言,有效激活LLM在海量據(jù)過去24個(gè)步長的歷史數(shù)據(jù),預(yù)測未來16個(gè)步長的風(fēng)電功率。圍從0.02到0.15,對(duì)應(yīng)的歷史風(fēng)力等級(jí)為輕風(fēng)。來風(fēng)速平穩(wěn),范圍在0.1至0.24之間,平均氣壓為1020hPa,屬于高氣壓環(huán)境。"ThesampleThesampleprovideshistoricalpowerdThenormalizeddatarangesfrTheThesampleprovidesnumericalweatherforecaswindspeed,winddirection,temperatureandairpressure.Thewindspeefrom0.1to0.24.Thewi模型微調(diào)模式十FrozenLoRA微調(diào)模式:凍結(jié)LLM骨干網(wǎng)絡(luò)的全部原始參數(shù),以保留其強(qiáng)大的通用知識(shí)不被破壞。在模型的關(guān)鍵模塊旁,注入兩個(gè)小型的、可訓(xùn)練的低秩核心優(yōu)勢:大幅降低訓(xùn)練所需的計(jì)算資源和顯存,使得在常規(guī)設(shè)備上微調(diào)大模型成為可能。并有效地將LLM的通用能力適配到風(fēng)電預(yù)測這一特定領(lǐng)根據(jù)在內(nèi)蒙古、甘肅、云南三個(gè)不同區(qū)域風(fēng)電場數(shù)據(jù)集上的測試結(jié)果,M2WLLM模型在所有預(yù)測時(shí)間尺度 (15分鐘、1小時(shí)、2小時(shí)、4小時(shí))上的平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)均顯著低于所有對(duì)比方法,包括傳統(tǒng)的LSTM、先進(jìn)的Transformer變體以及同為大模型架構(gòu)的GPT4TS。相較于僅處理數(shù)值的GPT4TS,M2WLLM通過多模態(tài)架構(gòu)和語義增強(qiáng)器,Table2:Forecastresultson1h(4烘epe""E華北電力大學(xué)華北電力大學(xué)實(shí)驗(yàn)結(jié)果華北電力大學(xué)華北電力大學(xué)實(shí)驗(yàn)結(jié)果NumberofGPT2Layerscpoch=3.(b)InferenceTimeNumberofGPT2Layerscpoch=3.(b)InferenceTime一、研究背景及意義面臨的挑戰(zhàn)模型定位M2WLLM利用一個(gè)已有的LLM強(qiáng)大的從零開始,專門為風(fēng)電功率預(yù)測領(lǐng)計(jì)使其能理解和處理風(fēng)電預(yù)礎(chǔ)模型,讓模型天生就深刻理解風(fēng)一大規(guī)模預(yù)訓(xùn)練:核心在于在一個(gè)解決方案M2WLLM的思路是利用已有的LLM的、領(lǐng)域?qū)S玫幕A(chǔ)模型,使其天然具備對(duì)風(fēng)電FanH,ShiY,FuZ,etal.WindFM:Zero-ShotWindPowerForecasting[J].arXivpreprintarXiv:2509.06311,數(shù)據(jù)集:WINDToolkit(NREL)覆蓋范圍:美國本土超過12.6萬個(gè)站點(diǎn)數(shù)據(jù)總量:2Tb左右(約1500億個(gè)時(shí)間步),包含風(fēng)速、風(fēng)向、功率、空氣密度、氣溫和氣壓等多維度變量時(shí)間維度:2007-2013年效果:通過學(xué)習(xí)如此龐大的數(shù)據(jù),WindFM掌握了普適的、可遷移的物理規(guī)律,而:斷斷+華北電力大學(xué)華北電力大學(xué)WindFM基座模型的訓(xùn)練核心,是在一個(gè)涵蓋了超過12.6萬個(gè)站點(diǎn)、總計(jì)約1500億時(shí)間步的龐大風(fēng)能專屬數(shù)據(jù)集上,進(jìn)行大規(guī)模的自回歸預(yù)訓(xùn)練。其訓(xùn)練任務(wù)借鑒了語言模型的成功范式:模型學(xué)習(xí)的并非原始數(shù)值,而是由“令牌化器”(Tokenizer),將連續(xù)的多維氣象與功率數(shù)據(jù)“翻譯”成一系列離散的“風(fēng)況詞匯”。通過自回歸地預(yù)測序列中的下一個(gè)“詞匯”,基座模型得以在海量多樣的數(shù)據(jù)上內(nèi)化并掌握了大氣物理與風(fēng)力發(fā)電之間普適的、可跨地域遷移的動(dòng)態(tài)規(guī)律,從而構(gòu)建了一個(gè)無需針對(duì)特定風(fēng)場進(jìn)行微調(diào)即可實(shí)現(xiàn)高精度預(yù)測的強(qiáng)大基礎(chǔ)。不個(gè)個(gè)個(gè)Time-seriesTokenizer通過一個(gè)基于Transformer的自編碼器架構(gòu),學(xué)習(xí)將一小段輸入數(shù)據(jù)壓縮成一個(gè)緊湊的離散表示,這個(gè)過程本質(zhì)上是一種高效的信息量化和編碼。采用層級(jí)化令牌結(jié)構(gòu),它巧妙地將每個(gè)令牌分解為兩部分:一個(gè)用于捕捉主要趨勢的“粗粒度”部分,和一個(gè)用于編碼精細(xì)細(xì)節(jié)的“細(xì)粒度”部分。這種“先宏觀、后微觀”的信息組織方式,為后續(xù)基座模型提供了一個(gè)結(jié)構(gòu)更清晰、更易于學(xué)習(xí)的輸入,從而顯著提升了其預(yù)測效率與精度。WindFM的預(yù)測結(jié)果在零樣本場景下表現(xiàn)極為突出。實(shí)驗(yàn)證明,在其僅有810萬參數(shù)的輕量級(jí)設(shè)計(jì)下,模型在未見過的美國風(fēng)場上的平均預(yù)測誤差,不僅優(yōu)于規(guī)模大數(shù)十倍的通用基礎(chǔ)模型,也超過了為目標(biāo)風(fēng)場專門訓(xùn)練的DLinear等先進(jìn)模型。UNDERLINE,RESPECTIVELY.TDENOTESTHEFORECASTHORIZON.44A1.I7L543AHL07514381L125476300100windrM-5amxFig.5.Zero-shotforecastingperformanceversusmodelsize.WindFM(reachievesstate-of-the-artaccuracy(lowerMAEandRMSE)whileparameter-efficicntthanotherleadingfoundationmodelsproportionaltotheparametercou模型還具備強(qiáng)大的跨地域泛化能力:一個(gè)完全在美國數(shù)據(jù)集上預(yù)訓(xùn)練的模型,直接對(duì)中國內(nèi)蒙古風(fēng)場進(jìn)行預(yù)測時(shí),其零樣本誤差(例如在144步預(yù)測中MAE為1.274)依然顯著低于在該數(shù)據(jù)上專門訓(xùn)練的TimeXer等模型(MAE1.549),這證明了WindFM成功學(xué)習(xí)并內(nèi)化了可全球遷移的物理規(guī)律。CROss-GEOGRAPHYGENERALIZATION:ZERO-SHOTFORECASTINGOCHINESEDATASET.THEBESTANDSECOND-BESTRESULTSINBOLDANDWITHANUNDERLINE 1.6271.6271.6291.5971.5981.5981.5971.5191.5172.0952.0952.0972.1252.0902.089 2.1842.1841.6711.6051.6371.4151.4181.4171.4161.3971.3941.6651.5741.5941.3871.3841.3841.3821.3801.3762.0181.9471.9701.8071.7561.7551.7541.8451.841Time-seriesTime-seriesReconstruction-0.18□VocabularySize(25)Fig.6.Impactoftokenizervocabularysize(2)onperformance.Increasingthevocabularysizeimprovesthemotoaconsistentdecreaseinbothtime-seriesdownstreampowerforecastingerror(right)inte模型還具有較好的概率預(yù)測的能力,在所有評(píng)估場景下,WindFM始終實(shí)現(xiàn)了最低的連續(xù)分級(jí)概率評(píng)分(CRPS)和平均分位數(shù)損失(AQL)。其性能優(yōu)于其他基礎(chǔ)模型(Chronos、Moirai),也優(yōu)于為該任務(wù)適配、且輸出符合高斯分布的站點(diǎn)專用模型。這些結(jié)果充分表明,該生成式框架在捕捉風(fēng)電固有的不確定性方面具有顯著有效性。6.6936.3740.9680.5220.985052608800.4630.86.7464.4030.98305340.98305340.8400.4550.8370.45408160431.7320.6.7464.4030.98305340.98305340.8400.4550.8370.45408160431.7320. AVG6.6956.J760.9330.507094305108020.4330.486.6936.3750.926IH726.6576.3560.890 2H646.6J86.3410.8204 5華北電力大學(xué)面向零樣本風(fēng)電功率預(yù)測的基座模型靈敏度分析面向零樣本風(fēng)電功率預(yù)測的基座模型靈敏度分析●分析了預(yù)測質(zhì)量對(duì)溫度(T)、top-p采樣、樣本數(shù)量這三個(gè)關(guān)鍵推理超參數(shù)的敏感性,發(fā)現(xiàn)確定性與概率性任務(wù)的最優(yōu)參數(shù)設(shè)置明顯不同。華北電力大學(xué)模型開源鏈接-模型開源鏈接-/shiyu-coder/WindFMWindFMisthefirstopen-sourcefoundationmodeldesignedforwindpowerforecastinmassivedatasetof~150billiontigenerationdynamicstodeliverstate-of-the-ar +WhyWindFM?Existingforecastingmethodsoftenforceatrade-off:eithertraicostlyanddoesn'tscaknowledge).WindFMoffersanewparadigmwithdistidiversedataset,enablingittocapturethefundamentpowergenerationacrossdifferentgeographiesandturbinoperationalenvironments.Itdemonstratesthatadomain-specificfocuscanachiewithoutthemassivescaleofgeneral-purposefoundationmode·PowerfulZero-ShotPerdeterministicandprobabilisticforecastsforunseenwndfarms.Thiseliminatestheneecollectonandmodeltraining,siof-distributiondatafromadifferentcontinent,pr GettingstartedwithWindFMissimple.ThefolloFirst,clonetherepositoryandinstallthereqgitclone/shiyu-cTheWindFMPredictorclassprovidesahigh-levelAPIformodeltogeneratingpredictimportmatplot
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年鄂爾多斯生態(tài)環(huán)境職業(yè)學(xué)院單招綜合素質(zhì)筆試參考題庫帶答案解析
- 2026江西九江市修水縣投資集團(tuán)有限公司招聘21人考試備考題庫及答案解析
- 2026貴州銅仁市第二人民醫(yī)院收費(fèi)室見習(xí)生招募1人考試備考試題及答案解析
- 2026自然資源部海島研究中心專業(yè)技術(shù)人員招聘15人考試備考題庫及答案解析
- 2026江西農(nóng)業(yè)大學(xué)國土資源與環(huán)境學(xué)院國土學(xué)院招聘臨時(shí)工1人考試備考題庫及答案解析
- 2026河北石家莊市供熱管理集團(tuán)有限公司勞務(wù)派遣制人員招聘2人考試備考試題及答案解析
- 2026年瀘州市部分企事業(yè)單位人才引進(jìn)88人備考題庫附答案詳解
- 2026年衡水市景縣人民醫(yī)院公開招聘醫(yī)護(hù)人員備考題庫及一套參考答案詳解
- 2026年鄭州市管城回族區(qū)紫東路社區(qū)衛(wèi)生服務(wù)中心招聘康復(fù)技士備考題庫及參考答案詳解一套
- 2026年維西縣人力資源市場關(guān)于公開招聘二名森林草原專業(yè)撲火隊(duì)隊(duì)員備考題庫及參考答案詳解一套
- 浙江省金華市2024-2025學(xué)年七年級(jí)上學(xué)期期末地理試卷(含答案)
- 第五單元生物與環(huán)境檢測卷 2025-2026學(xué)年人教版八年級(jí)生物上冊(cè)(含解析)
- 生活老師面試試題及答案
- 農(nóng)村買墓地合同的范本
- 零售行業(yè)的店面管理培訓(xùn)資料
- 農(nóng)業(yè)氣象基礎(chǔ)知識(shí)課件
- 培訓(xùn)課件電氣接地保護(hù)培訓(xùn)課件
- 信息通信建設(shè)工程預(yù)算定額 (2017版)第二冊(cè)+有線通信設(shè)備安裝工程預(yù)算定額
- 污水管網(wǎng)工程監(jiān)理月報(bào)
- 安徽涵豐科技有限公司年產(chǎn)6000噸磷酸酯阻燃劑DOPO、4800噸磷酸酯阻燃劑DOPO衍生品、12000噸副產(chǎn)品鹽酸、38000噸聚合氯化鋁、20000噸固化劑項(xiàng)目環(huán)境影響報(bào)告書
- GB/T 17215.322-2008交流電測量設(shè)備特殊要求第22部分:靜止式有功電能表(0.2S級(jí)和0.5S級(jí))
評(píng)論
0/150
提交評(píng)論