版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
摘要為充分捕獲路網(wǎng)交通流數(shù)據(jù)的時(shí)空特征,本文提出一種解糾纏自適應(yīng)時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(DSTGCN)。通過(guò)分析預(yù)測(cè)時(shí)段的交通流量與歷史交通流量之間的時(shí)空關(guān)聯(lián),將輸入路網(wǎng)交通流量數(shù)據(jù)多尺度劃分,形成多模式時(shí)空組件。然后通過(guò)由門(mén)控時(shí)序卷積網(wǎng)絡(luò)構(gòu)成的時(shí)間特征捕獲模塊和解糾纏自適應(yīng)圖卷積網(wǎng)絡(luò)構(gòu)成的空間特征捕獲模塊組成時(shí)空網(wǎng)絡(luò)模塊。利用多層時(shí)空網(wǎng)絡(luò)模塊進(jìn)行特征提取,深度挖掘路網(wǎng)交通流量數(shù)據(jù)時(shí)空關(guān)聯(lián)進(jìn)行交通流預(yù)測(cè)。關(guān)鍵詞:交通流預(yù)測(cè);時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò);解糾纏圖卷積第一章緒論交通流預(yù)測(cè)方法是指利用交通系統(tǒng)中采集存儲(chǔ)的交通歷史數(shù)據(jù),結(jié)合路網(wǎng)結(jié)構(gòu),預(yù)測(cè)未來(lái)交通路網(wǎng)中不同位置交通流的方法,是智慧交通系統(tǒng)的重要組成部分。交通流預(yù)測(cè)通過(guò)預(yù)測(cè)未來(lái)交通狀況,掌握道路信息,指導(dǎo)交通規(guī)劃,為居民出行節(jié)約時(shí)間。因此充分準(zhǔn)確地挖掘交通數(shù)據(jù)中的信息,模擬時(shí)間維度及空間維度數(shù)據(jù)間的影響,進(jìn)而實(shí)現(xiàn)精確的交通預(yù)測(cè),對(duì)智能交通系統(tǒng)發(fā)展具尤為重要。豐富、充足的交通歷史數(shù)據(jù)是交通流預(yù)測(cè)任務(wù)的基礎(chǔ)。通過(guò)挖掘交通歷史數(shù)據(jù)中隱含的數(shù)據(jù)間時(shí)序關(guān)聯(lián)及不同地理位置的相互關(guān)聯(lián),智能算法能夠?qū)崿F(xiàn)更加精準(zhǔn)的未來(lái)交通狀態(tài)評(píng)估。目前城市交通系統(tǒng)中大量應(yīng)用的傳感器設(shè)備為交通流預(yù)測(cè)相關(guān)研究提供了數(shù)據(jù)基礎(chǔ)條件。因此高精度,高效率的交通流預(yù)測(cè)方法成為了眾多學(xué)者致力于研究的一個(gè)課題,具有很大的應(yīng)用價(jià)值。第二章深度學(xué)習(xí)相關(guān)技術(shù)2.1深度殘差網(wǎng)絡(luò)傳統(tǒng)的深度學(xué)習(xí)模型中,隨著網(wǎng)絡(luò)深度的增加,網(wǎng)絡(luò)的表達(dá)能力不斷增強(qiáng)。而當(dāng)網(wǎng)絡(luò)深度增加到一定的數(shù)目以后,性能不但沒(méi)有提升,反而出現(xiàn)顯著退化,這種問(wèn)題稱(chēng)為網(wǎng)絡(luò)退化問(wèn)題。He等人提出深度殘差網(wǎng)絡(luò)來(lái)解決網(wǎng)絡(luò)退化問(wèn)題,其在圖像識(shí)別、分割檢測(cè)和分類(lèi)任務(wù)中普遍運(yùn)用。一個(gè)訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò),如果能滿足堆上一層使得堆疊后的輸出與其輸入相同,也就是單位映射,其加深網(wǎng)絡(luò)深度后結(jié)果不應(yīng)該會(huì)變差,因?yàn)槠鋯挝挥呈沟闷漭斎肱c輸出相同。這說(shuō)明傳統(tǒng)的多層深度學(xué)習(xí)網(wǎng)絡(luò)難以表達(dá)單位映射。因此He等人提出通過(guò)殘差學(xué)習(xí)來(lái)解決網(wǎng)絡(luò)退化問(wèn)題。2.2注意力機(jī)制注意力機(jī)制借鑒了人類(lèi)通過(guò)視覺(jué)和聽(tīng)覺(jué)接收信息時(shí)會(huì)將注意力放在某些重要的特征上,而第一時(shí)間忽略某些無(wú)用信息的信息處理機(jī)制。例如在人類(lèi)接受視覺(jué)感官傳來(lái)的圖像信息時(shí),大腦會(huì)掃描所有圖像信息,結(jié)合一定原則優(yōu)先選出重要區(qū)域進(jìn)行關(guān)注;在面對(duì)長(zhǎng)語(yǔ)句時(shí),大腦會(huì)將注意力放在最能表達(dá)語(yǔ)義的關(guān)鍵詞上,并一定程度忽略文字的先后出現(xiàn)次序,這也是有時(shí)文字的排序順序不影響語(yǔ)句的表達(dá)語(yǔ)義的原因。這種人類(lèi)大腦的注意力機(jī)制可以幫助人類(lèi)在接受大量信息時(shí),快速注意到關(guān)鍵部分,實(shí)現(xiàn)對(duì)信息的高速理解和處理。學(xué)者最早將注意力機(jī)制運(yùn)用于機(jī)器翻譯領(lǐng)域,經(jīng)過(guò)不斷發(fā)展,目前注意力機(jī)制已經(jīng)稱(chēng)為深度學(xué)習(xí)中的常用手段,廣泛運(yùn)用于自然語(yǔ)言處理,計(jì)算機(jī)視覺(jué)和時(shí)序預(yù)測(cè)等領(lǐng)域。第三章基于時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測(cè)模型3.1交通流量預(yù)測(cè)任務(wù)定義交通流量預(yù)測(cè)任務(wù)是通過(guò)交通路網(wǎng)上N個(gè)傳感器觀測(cè)到的交通流量歷史數(shù)據(jù),預(yù)測(cè)未來(lái)一段時(shí)間此交通路網(wǎng)上的交通流量。根據(jù)交通路網(wǎng)的空間特征,將傳感器網(wǎng)絡(luò)結(jié)構(gòu)定義為一個(gè)圖結(jié)構(gòu):(3.1)其中V為節(jié)點(diǎn)集,一個(gè)節(jié)點(diǎn)代表一個(gè)傳感器,集合大小為N。E為邊集,表示傳感器節(jié)點(diǎn)間關(guān)聯(lián)程度。A為鄰接矩陣,以矩陣的形式表示各個(gè)節(jié)點(diǎn)的連接程度關(guān)系,其構(gòu)建方式為:(3.2)式中,是代表節(jié)點(diǎn)與節(jié)點(diǎn)間的連接關(guān)系,代表節(jié)點(diǎn)與節(jié)點(diǎn)組成的邊。代表節(jié)點(diǎn)與節(jié)點(diǎn)間連接的關(guān)聯(lián)強(qiáng)度。如圖3.1所示,在觀測(cè)時(shí)段內(nèi),隨著交通傳感器網(wǎng)絡(luò)連續(xù)多個(gè)采樣,形成交通流量時(shí)空?qǐng)D數(shù)據(jù)。將交通路網(wǎng)圖上傳感器節(jié)點(diǎn)觀察到的交通流數(shù)據(jù)表示為,為節(jié)點(diǎn)的特征數(shù),設(shè)表示在時(shí)刻觀測(cè)到的交通流數(shù)據(jù),則交通流量預(yù)測(cè)任務(wù)的目標(biāo)就是學(xué)習(xí)一個(gè)交通流量預(yù)測(cè)映射函數(shù),將觀測(cè)時(shí)間段的交通流數(shù)據(jù)映射到預(yù)測(cè)時(shí)間段的交通流,交通流量預(yù)測(cè)任務(wù)可以表示如下:(3.3)(3.4)(3.5)圖3.1時(shí)空?qǐng)D3.2基于解糾纏自適應(yīng)時(shí)空?qǐng)D卷積網(wǎng)絡(luò)的交通流量預(yù)測(cè)模型3.2.1多模式時(shí)空組件融合目前大多數(shù)的交通流預(yù)測(cè)算法模型中,都只用預(yù)測(cè)時(shí)間段的最近的前一段時(shí)間作為歷史數(shù)據(jù)輸入進(jìn)行交通輸入,例如只輸入前一個(gè)小時(shí)的交通流數(shù)據(jù)進(jìn)行后一個(gè)小時(shí)的交通流量預(yù)測(cè)。交通流量在較長(zhǎng)時(shí)間尺度內(nèi)存在顯著的周期性和趨勢(shì)性。如何捕獲交通流量數(shù)據(jù)的在較長(zhǎng)時(shí)間尺度內(nèi)存在顯著的時(shí)空類(lèi)周期性和趨勢(shì)性,也是交通流時(shí)空預(yù)測(cè)問(wèn)題一個(gè)需要解決的難點(diǎn)。因此,為深度挖掘預(yù)測(cè)時(shí)段的交通流量與歷史交通流量之間的時(shí)空關(guān)聯(lián),本文將歷史交通流數(shù)據(jù)劃分為3個(gè)尺度,建立多模式時(shí)空組件。根據(jù)數(shù)據(jù)集傳感器采集頻率情況,將實(shí)驗(yàn)預(yù)測(cè)時(shí)間定為12個(gè)時(shí)間間隔點(diǎn),每個(gè)時(shí)間段5分鐘,則預(yù)測(cè)時(shí)間長(zhǎng)度為一小時(shí)。3.2.2門(mén)控時(shí)序卷積網(wǎng)絡(luò)時(shí)間特征捕獲模塊旨在深度的捕獲交通流量數(shù)據(jù)的動(dòng)態(tài)時(shí)序特征。對(duì)于時(shí)序特征的提取,現(xiàn)有方法多是基于RNNs的模型,普遍存在對(duì)于捕獲長(zhǎng)期時(shí)序依賴較弱的問(wèn)題。其循環(huán)網(wǎng)絡(luò)通過(guò)對(duì)連續(xù)的時(shí)序輸入進(jìn)行編碼特征提取,遞歸捕獲連續(xù)的時(shí)序特征,會(huì)導(dǎo)致長(zhǎng)時(shí)間前的特征信息逐漸消失,因此鄰近時(shí)刻的特征相較于長(zhǎng)期的特征會(huì)對(duì)輸出特征有更大的影響。在進(jìn)行多步時(shí)序預(yù)測(cè)時(shí),因其網(wǎng)絡(luò)結(jié)構(gòu)利用前一步的輸出特征作為之后一步的輸入特征,容易造成誤差累積從而影響多步預(yù)測(cè)性能。另一方面,一般的RNN的方法,普遍存在梯度消失或梯度爆炸的問(wèn)題;變體模型如LSTM、GRU等,則會(huì)需要更多的資源,存在訓(xùn)練困難的問(wèn)題,而且難以應(yīng)用在處理大量且更長(zhǎng)的時(shí)間序列預(yù)測(cè)問(wèn)題上。因此,本節(jié)本節(jié)提出的交通流預(yù)測(cè)模型采用結(jié)合門(mén)控機(jī)制的時(shí)序卷積網(wǎng)絡(luò)來(lái)提取交通流數(shù)據(jù)的時(shí)序特征。基于卷積的網(wǎng)絡(luò)不需要遞歸連接且能夠進(jìn)行并行運(yùn)算,訓(xùn)練速度相較于傳統(tǒng)RNN及其變體網(wǎng)絡(luò)有很大的優(yōu)勢(shì)。如圖3.5所示,門(mén)控時(shí)序卷積網(wǎng)絡(luò)(GatedTCN)通過(guò)時(shí)序門(mén)控機(jī)制進(jìn)行有信息流入控制,結(jié)合因果卷積和空洞卷積對(duì)輸入交通流信息進(jìn)行時(shí)序特征提取。圖3.2門(mén)控時(shí)序卷積網(wǎng)絡(luò)結(jié)構(gòu)在TCN構(gòu)架中,將路網(wǎng)中單個(gè)節(jié)點(diǎn)的交通流數(shù)據(jù)在時(shí)間維度視為一維向量,應(yīng)用因果卷積結(jié)合空洞卷積對(duì)其進(jìn)行一維卷積操作,捕獲時(shí)序特征。因果卷積保證了在進(jìn)行時(shí)序預(yù)測(cè)時(shí)的嚴(yán)格因果相關(guān)性,預(yù)測(cè)時(shí)刻的特征只和歷史時(shí)刻相關(guān),無(wú)法感知到未來(lái)的信息。公式表示如下:(3.7)空洞卷積在標(biāo)準(zhǔn)卷積的基礎(chǔ)上增加了空洞系數(shù),在卷積核中添加空洞,加大了卷積核的提取范圍。從而使空洞卷積不用堆疊很深的網(wǎng)絡(luò)也能夠提高感受野的范圍。因此本節(jié)提出的時(shí)序卷積的公式表示為:(3.8)其中為一維時(shí)間序列信號(hào),為時(shí)序卷積核,為空洞系數(shù),表示空洞采樣頻率,表示卷積所在的層數(shù)。一般而言隨著層數(shù)越高設(shè)置的空洞系數(shù)也越大,這樣較少的堆疊深度就能捕獲到交通流輸入數(shù)據(jù)全局的時(shí)序關(guān)聯(lián),獲得相較RNN更長(zhǎng)的時(shí)間依賴,而且避免了因堆疊過(guò)深卷積網(wǎng)絡(luò)帶來(lái)的梯度消失和網(wǎng)絡(luò)退化問(wèn)題。門(mén)控機(jī)制在RNN變體結(jié)構(gòu)如LSTM、GRU等中有大量應(yīng)用。門(mén)實(shí)際就是一種對(duì)特征向量進(jìn)行控制的組件,它輸入一個(gè)向量返回一個(gè)值域是(0,1)的實(shí)數(shù)。通常將門(mén)的輸出向量按元素對(duì)應(yīng)位置乘以我們想要控制的特征向量,從而達(dá)到控制目的。公式表示如下:(3.9)式中,為門(mén)的權(quán)重參數(shù),為偏置參數(shù)。從公式可以看出,門(mén)是激活函數(shù)使用了函數(shù)的一層神經(jīng)網(wǎng)絡(luò),保證了其輸出值域?yàn)椋?,1)。當(dāng)門(mén)輸出為0時(shí),與特征向量乘積都會(huì)得到零向量等效于該輸入信息不可通過(guò)門(mén);當(dāng)輸出為1時(shí),特征向量與之相乘不會(huì)有任何損失等效于該輸入信息可以完全通過(guò)。所以門(mén)通過(guò)半開(kāi)半閉的狀態(tài)控制有效信息的流入和無(wú)效信息的丟棄。在門(mén)控時(shí)序卷積網(wǎng)絡(luò)中,包括了兩個(gè)TCN網(wǎng)絡(luò)模塊,這兩個(gè)TCN模塊使用了不同的激活函數(shù)。TCN-a模塊使用作為激活函數(shù),對(duì)提取的時(shí)序特征做非線性映射,相當(dāng)于被控制的特征向量。TCN-b模塊使用作為激活函數(shù),作為門(mén)控機(jī)制中的門(mén)組件。這樣的結(jié)構(gòu)保證了待處理的特征向量與門(mén)輸出的控制向量結(jié)構(gòu)相同,其中控制向量中每個(gè)元素的值表示被控制的特征向量運(yùn)行通過(guò)門(mén)的比率。因此本節(jié)提出的門(mén)控機(jī)制公式表示如下:(3.10)式中, 為歷史路網(wǎng)交通流特征輸入,為門(mén)控時(shí)序卷積網(wǎng)絡(luò)提取的特征輸出。 ,和分別為捕獲時(shí)序依賴性TCN-a模塊的卷積核,偏置參數(shù)和激活函數(shù)。,和分別為門(mén)控組件TCN-b模塊的卷積核,偏置參數(shù)和激活函數(shù)。為哈達(dá)瑪(Hadamard)積,表示多維度向量對(duì)應(yīng)位置元素相乘。代表卷積操作。加入了門(mén)控機(jī)制的時(shí)序卷積網(wǎng)絡(luò),通過(guò)對(duì)有效信息的門(mén)控篩選,進(jìn)一步提高了本節(jié)提出交通流預(yù)測(cè)模型對(duì)時(shí)序依賴的捕獲性能。3.2.3解糾纏自適應(yīng)圖卷積網(wǎng)絡(luò)交通道路網(wǎng)絡(luò)中的各個(gè)節(jié)點(diǎn)間存在復(fù)雜且多層次的空間依賴。根據(jù)路網(wǎng)中傳感器分布位置的連接關(guān)系或者路網(wǎng)距離構(gòu)建的交通路網(wǎng)圖結(jié)構(gòu),只能淺顯的捕獲到交通路網(wǎng)的表層局部空間特征。比如根據(jù)距離構(gòu)建的無(wú)向圖結(jié)構(gòu)難以表示交通路網(wǎng)中道路的單向性;根據(jù)連接關(guān)系構(gòu)建的圖結(jié)構(gòu)中,一個(gè)節(jié)點(diǎn)受其鄰域內(nèi)鄰居節(jié)點(diǎn)的影響權(quán)重比例相同,這導(dǎo)致難以有效模擬出復(fù)雜的交通路網(wǎng)場(chǎng)景中不同節(jié)點(diǎn)間相互的影響差異。同時(shí)在真實(shí)交通路網(wǎng)場(chǎng)景中存在兩節(jié)點(diǎn)間路網(wǎng)距離較遠(yuǎn)但其相互影響依賴卻很強(qiáng)的情況,傳統(tǒng)的圖結(jié)構(gòu)構(gòu)建模式難以直接體現(xiàn)這種依賴,從而降低了圖神經(jīng)網(wǎng)絡(luò)捕獲交通流的空間特征性能。另一方面,多尺度的圖卷積網(wǎng)絡(luò)雖然能較好的提取交通路網(wǎng)中的空間依賴,但其也存在過(guò)平滑和權(quán)重偏倚的問(wèn)題。因此,本節(jié)本節(jié)提出的交通流預(yù)測(cè)模型采用解糾纏的自適應(yīng)圖卷積網(wǎng)絡(luò)來(lái)提取交通流數(shù)據(jù)的空間特征。如圖3.6所示,解糾纏的自適應(yīng)圖卷積網(wǎng)絡(luò)利用可學(xué)習(xí)的自適應(yīng)矩陣和解糾纏的圖卷積網(wǎng)絡(luò)挖掘交通網(wǎng)絡(luò)中的深層次空間特征。自適應(yīng)的鄰接矩陣通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式,在網(wǎng)絡(luò)訓(xùn)練過(guò)程中不斷捕獲變量之間的空間關(guān)聯(lián)。同時(shí)采用帶權(quán)重的有向圖的鄰接矩陣來(lái)模擬道路交通路網(wǎng)中上有節(jié)點(diǎn)狀態(tài)影響下游節(jié)點(diǎn)狀態(tài)的情況,并且為鄰居節(jié)點(diǎn)在聚合過(guò)程中的比重賦予區(qū)分度。通過(guò)訓(xùn)練中反向傳播的更新,自適應(yīng)的鄰接矩陣能主動(dòng)捕獲路網(wǎng)距離較遠(yuǎn)或不存在連接關(guān)系的節(jié)點(diǎn)間隱含的空間依賴,有效補(bǔ)充傳統(tǒng)圖構(gòu)建模式中丟失的空間信息。本節(jié)提出的自適應(yīng)矩陣構(gòu)建公式表示如下:(3.11)(3.12)(3.13)式中,,表示交通路網(wǎng)中節(jié)點(diǎn)的可以不斷學(xué)習(xí)的嵌入向量, 為節(jié)點(diǎn)嵌入向量的隱層維度大小,,為特征變換模型參數(shù),為激活函數(shù)飽和率。通過(guò)公式3.13得到的自適應(yīng)矩陣是一個(gè)非對(duì)稱(chēng)的有向圖鄰接矩陣,激活函數(shù)正則化鄰接矩陣,使得矩陣元素取值在(0,1)之間。同時(shí),在現(xiàn)實(shí)交通路網(wǎng)中,對(duì)特定交通節(jié)點(diǎn)一般而言只具有相對(duì)較少的節(jié)點(diǎn)擁有較大關(guān)聯(lián)性。若建??紤]圖中所有節(jié)點(diǎn)的關(guān)聯(lián)性,會(huì)大大提高隨后圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行空間特征提取的計(jì)算代價(jià)。因此,我們每個(gè)節(jié)點(diǎn)只選擇鄰接關(guān)系最緊密的個(gè)節(jié)點(diǎn),然后將其余節(jié)點(diǎn)在鄰接矩陣中對(duì)應(yīng)關(guān)系置為零。這樣可以有效減少鄰居節(jié)點(diǎn)個(gè)數(shù),得到新的鄰接矩陣。經(jīng)過(guò)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)之后有效挖掘交通流數(shù)據(jù)中的節(jié)點(diǎn)之間的空間隱含關(guān)聯(lián)從而更符合真實(shí)交通路網(wǎng)場(chǎng)景,同時(shí)該矩陣的稀疏特性可以有效減低計(jì)算開(kāi)銷(xiāo)。圖3.6解糾纏自適應(yīng)圖卷積網(wǎng)絡(luò)結(jié)構(gòu)解糾纏的圖卷積網(wǎng)絡(luò)通過(guò)劃分解糾纏的多尺度領(lǐng)域進(jìn)行圖卷積解決了過(guò)平滑和權(quán)重偏倚問(wèn)題并且能夠更靈活的捕獲到交通路網(wǎng)節(jié)點(diǎn)間的空間特性。常規(guī)的多尺度圖卷積神經(jīng)網(wǎng)絡(luò)通過(guò)多尺度劃分用以提取k-hop鄰域的信息進(jìn)行特征提取,層與層之間的傳遞公式表示如下:(3.14)式中,表示k階鄰接矩陣的正則化拉普拉斯矩陣。通過(guò)這種方式,可以為較遠(yuǎn)鄰居和較近鄰居分別創(chuàng)建獨(dú)立的權(quán)重從而更豐富的捕獲節(jié)點(diǎn)間的空間特性。但是將其運(yùn)用在路網(wǎng)交通流預(yù)測(cè)時(shí),會(huì)因?yàn)槁肪W(wǎng)交通流數(shù)據(jù)固有特征而產(chǎn)生權(quán)重偏倚問(wèn)題。如在交通路網(wǎng)中存在特定子區(qū)域內(nèi)節(jié)點(diǎn)間具有較強(qiáng)的連接相關(guān)性時(shí),k-hop領(lǐng)域鄰接矩陣內(nèi)元素的關(guān)聯(lián)權(quán)重就只會(huì)偏向這塊區(qū)域,使得其中節(jié)點(diǎn)間的關(guān)聯(lián)權(quán)重指數(shù)級(jí)上升,導(dǎo)致丟失了其中節(jié)點(diǎn)與別的區(qū)域節(jié)點(diǎn)間存在的空間關(guān)聯(lián)信息。解糾纏的自適應(yīng)圖卷積在前述自適應(yīng)鄰接矩陣基礎(chǔ)上,設(shè)定解糾纏尺度因子,由于自適應(yīng)鄰接矩陣中元素取值為(0,1),所以定義劃分尺度如下式:(3.15)定義解糾纏的鄰接矩陣 ,公式表示如下:(3.16)表示一系列無(wú)權(quán)的子圖,他對(duì)于不同尺度的節(jié)點(diǎn)關(guān)系具有相同的權(quán)重,用它替換式3.14中的,解糾纏的自適應(yīng)圖卷積網(wǎng)絡(luò)層與層之間的傳遞公式表示如下:(3.17)式中,表示第層網(wǎng)絡(luò)中節(jié)點(diǎn)的特征表示,表示非線性激活函數(shù),表示標(biāo)準(zhǔn)化拉普拉斯矩陣,為可訓(xùn)練的參數(shù)。通過(guò)解糾纏尺度的劃分,同一尺度下的關(guān)聯(lián)關(guān)系具有相同權(quán)重,讓模型能夠更進(jìn)一步突破較遠(yuǎn)鄰居和較近鄰居的限制,捕獲到交通路網(wǎng)中潛在的空間特征。同時(shí),通過(guò)去糾纏的多尺度劃分,在劃分后的子圖上進(jìn)行圖卷積操作,避免了大量無(wú)關(guān)信息的聚合,過(guò)平滑問(wèn)題也得到了緩解。3.3實(shí)驗(yàn)與分析3.3.1實(shí)驗(yàn)數(shù)據(jù)集及預(yù)處理在本研究中,使用兩個(gè)由加州交通運(yùn)輸署的性能評(píng)測(cè)系統(tǒng)采集的公開(kāi)交通數(shù)據(jù)集進(jìn)行交通流量預(yù)測(cè)模型評(píng)估實(shí)驗(yàn)。(1)PeMSD4:數(shù)據(jù)集包括舊金山灣區(qū)的307個(gè)交通傳感器采集的交通流數(shù)據(jù)和傳感器的地理位置信息。包含交通流量、道路占有率和平均車(chē)速三種交通流特征參數(shù)。時(shí)間跨度為2018年1月1日到2018年2月28日。(2)PeMSD8:數(shù)據(jù)集包括圣貝納迪諾地區(qū)的170個(gè)交通傳感器采集的交通流數(shù)據(jù)和傳感器的地理位置信息。包含交通流量、道路占有率和平均車(chē)速三種交通流特征參數(shù)。時(shí)間跨度為2016年7月1日到2018年8月31日。兩個(gè)數(shù)據(jù)集的數(shù)據(jù)采樣時(shí)間間隔均為5分鐘。本文將數(shù)據(jù)集按前60%作為訓(xùn)練集,中間20%作為驗(yàn)證集,最后20%作為測(cè)試集。其中,訓(xùn)練集用于深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)網(wǎng)絡(luò)參數(shù),驗(yàn)證集用于測(cè)試超參數(shù)的最優(yōu)選擇,測(cè)試集用于最終測(cè)試模型的預(yù)測(cè)性能。然后為了提升模型收斂速度,在將交通流特征輸入模型之前進(jìn)行Z-Score標(biāo)準(zhǔn)化處理。3.3.2交通流預(yù)測(cè)評(píng)價(jià)指標(biāo)本文使用三種評(píng)價(jià)指標(biāo),分別為平均絕對(duì)誤差(MeanAbsoluteError,MAE)、均方根誤差(RootMeanSquareError,RMSE)、平均絕對(duì)百分比誤差(MeanAbsolutePercentageError,MAPE)。其中,MAE為預(yù)測(cè)值與實(shí)測(cè)值之間絕對(duì)誤差的平均數(shù),能夠直觀反應(yīng)預(yù)測(cè)誤差大小。RMSE為預(yù)測(cè)值與實(shí)測(cè)值的誤差平方根,能夠識(shí)別異常值,用來(lái)定量衡量預(yù)測(cè)誤差的離散程度。MAPE為預(yù)測(cè)值與實(shí)測(cè)值絕對(duì)誤差值與實(shí)測(cè)值的比,反映預(yù)測(cè)值相對(duì)于實(shí)測(cè)值的偏離程度,即不僅考慮到預(yù)測(cè)值與實(shí)測(cè)值的偏差,還會(huì)考慮到偏差與真實(shí)值的比例。若真實(shí)值為50和200,預(yù)測(cè)值為30和180,其絕對(duì)誤差一樣但是MAPE值差距會(huì)很大,所以MAPE為評(píng)價(jià)模型預(yù)測(cè)性能的重要指標(biāo)。當(dāng)MAE、MAPE、RMSE的值越小時(shí),說(shuō)明模型預(yù)測(cè)性能越好。各指標(biāo)的計(jì)算公式如下:(3.18)(3.19)(3.20)式中, 和分別為交通流量預(yù)測(cè)值和真實(shí)值,為數(shù)據(jù)樣本量。3.3.3基準(zhǔn)模型本文采用的基準(zhǔn)模型包括傳統(tǒng)的時(shí)序預(yù)測(cè)模型和基于深度學(xué)習(xí)的預(yù)測(cè)模型兩類(lèi),具體如下:(1)ARIMA:差分自回歸移動(dòng)平均模型,在時(shí)間預(yù)測(cè)鄰域具有廣泛應(yīng)用。(2)VAR:向量自回歸,能夠捕獲到多變量間的線性關(guān)系。(3)LSTM:長(zhǎng)短期記憶網(wǎng)絡(luò),是循環(huán)神經(jīng)網(wǎng)絡(luò)的變體模型,通過(guò)門(mén)控機(jī)制有效緩解循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)長(zhǎng)期時(shí)間相關(guān)信息丟失問(wèn)題。(4)DCRNN:擴(kuò)散圖卷積循環(huán)網(wǎng)絡(luò),使用擴(kuò)散圖卷積進(jìn)行空間特征捕獲,結(jié)合使用基于LSTM的Encoder-Decoder架構(gòu)來(lái)對(duì)時(shí)間特征捕獲。(5)STGCN:時(shí)空?qǐng)D卷積網(wǎng)絡(luò),通過(guò)由兩個(gè)時(shí)域卷積塊和一個(gè)空間域卷積塊組成的時(shí)空卷積塊堆疊組成的網(wǎng)絡(luò)進(jìn)行交通流量預(yù)測(cè)。(6)ASTGCN:基于注意力的時(shí)空?qǐng)D卷積網(wǎng)絡(luò),從時(shí)間周期設(shè)計(jì)近期、天周期、周周期三個(gè)獨(dú)立組件進(jìn)行交通流周期性質(zhì)捕獲,每個(gè)組件由基于注意力機(jī)制的時(shí)空卷積網(wǎng)絡(luò)模塊堆疊組成進(jìn)行時(shí)空特征捕獲。(7)GraphWaveNet:建立自適應(yīng)圖鄰接矩,并采用擴(kuò)散圖卷積進(jìn)行空間特征捕獲,采用時(shí)序卷積進(jìn)行時(shí)間特征捕獲。(8)AGCRN:自適應(yīng)卷積圖循環(huán)網(wǎng)絡(luò),提出節(jié)點(diǎn)自適應(yīng)參數(shù)學(xué)習(xí)和自適應(yīng)矩陣增強(qiáng)圖卷積再結(jié)合門(mén)控循環(huán)網(wǎng)絡(luò)進(jìn)行交通流預(yù)測(cè)。3.3.4實(shí)驗(yàn)參數(shù)設(shè)置(1)深度學(xué)習(xí)常用參數(shù)。批量大?。˙atchSize)設(shè)置為16,學(xué)習(xí)率(LearningRate)設(shè)置為0.001,Dropout比例設(shè)置為0.2,采用Adam優(yōu)化器。(2)門(mén)控時(shí)序卷積網(wǎng)絡(luò)中卷積核的尺寸大?。↘ernelSize)。在時(shí)間依賴建模中,我們采用了門(mén)控時(shí)序卷積網(wǎng)絡(luò),其中時(shí)序卷積核的尺度大小對(duì)于不同的時(shí)序任務(wù)有著不同的取值。如圖3.7、3.8所示,通過(guò)在兩個(gè)數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)與分析,選取卷積核尺寸大小為3時(shí),交通流預(yù)測(cè)指標(biāo)平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)均降到最低,模型表現(xiàn)出較好性能。因此將卷積核的尺寸大小設(shè)置為3。(3)解糾纏自適應(yīng)圖卷積網(wǎng)絡(luò)中自適應(yīng)矩陣節(jié)點(diǎn)嵌入向量的隱層維度大小值。如公式3.11、3.12、3.13所示,自適應(yīng)矩陣通過(guò)節(jié)點(diǎn)嵌入向量的不斷訓(xùn)練學(xué)習(xí)生成,其中值表示節(jié)點(diǎn)嵌入向量中每個(gè)節(jié)點(diǎn)的特征維度,其值設(shè)定如果太小不足以有效捕獲交通路網(wǎng)結(jié)構(gòu)空間特征,太大則會(huì)增加模型計(jì)算復(fù)雜度,影響模型預(yù)測(cè)性能。如圖3.9、3.10所示,通過(guò)在兩個(gè)數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)與分析,選取值為8時(shí),MAE、RMS和MAPE均降到最低,模型表現(xiàn)出較好性能。因此將隱層維度大小值設(shè)置為8。(4)解糾纏自適應(yīng)圖卷積網(wǎng)絡(luò)中解糾纏尺度因子值K。解糾纏尺度因子決定解糾纏鄰接矩陣的劃分個(gè)數(shù),如式3.16所示,解糾纏尺度因子越大,劃分矩陣越多,劃分粒度越細(xì),隨之計(jì)算復(fù)雜度也增加。如圖3.11、3.12所示,通過(guò)在兩個(gè)數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)與分析,選取K值為4時(shí),除了在PeMSD4數(shù)據(jù)集上MAPE略微低于K取值為8時(shí),其余MAE、RMSE和MAPE均降到最低。因此綜合考慮將解糾纏尺度因子值K設(shè)置為4。(5)時(shí)空網(wǎng)絡(luò)模塊堆疊層數(shù)值L。本節(jié)提出的解糾纏自適應(yīng)時(shí)空?qǐng)D卷積網(wǎng)絡(luò)由時(shí)空網(wǎng)絡(luò)模塊堆疊組成,堆疊層數(shù)L不宜太大,如圖3.13、3.14所示,通過(guò)在兩個(gè)數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)與分析,選取L值為2時(shí),模型表現(xiàn)出較好性能,除PeMSD4數(shù)據(jù)集上MAPE值,其余MAE、RMSE和MAPE均降到最低。因此將時(shí)空網(wǎng)絡(luò)模塊堆疊層數(shù)值L設(shè)置為2。(b)(c)圖3.7PeMSD4數(shù)據(jù)集上不同時(shí)序卷積核大小性能對(duì)比 (b)(c)圖3.8PeMSD8數(shù)據(jù)集上不同時(shí)序卷積核大小性能對(duì)比(b) (c)圖3.9PeMSD4數(shù)據(jù)集上不同U值大小性能對(duì)比(b) (c)圖3.10PeMSD8數(shù)據(jù)集上不同U值大小性能對(duì)比(b) (c)圖3.11PeMSD4數(shù)據(jù)集上不同K值大小性能對(duì)比(b) (c)圖3.12PeMSD8數(shù)據(jù)集上不同K值大小性能對(duì)比(b) (c)圖3.13PeMSD4數(shù)據(jù)集上不同L值大小性能對(duì)比(b) (c)圖3.14PeMSD8數(shù)據(jù)集上不同L值大小性能對(duì)比3.3.5實(shí)驗(yàn)結(jié)果對(duì)比將本節(jié)提出的基于DSTGCN的交通流量預(yù)測(cè)模型在PeMSD4和PeMSD8數(shù)據(jù)集上與前述8種基線模型進(jìn)行對(duì)比。通過(guò)各模型對(duì)預(yù)測(cè)未來(lái)一小時(shí)的交通路網(wǎng)節(jié)點(diǎn)的交通流量的實(shí)驗(yàn)結(jié)果計(jì)算交通流預(yù)測(cè)評(píng)價(jià)指標(biāo)MAE、RMSE和MAPE,從而對(duì)模型預(yù)測(cè)性能進(jìn)行性能評(píng)估。表3.1和表3.2分別展示了各個(gè)預(yù)測(cè)模型在PeMSD4和PeMSD8數(shù)據(jù)集上,15分鐘(3個(gè)時(shí)間步長(zhǎng))、30分鐘(6個(gè)時(shí)間步長(zhǎng))和一小時(shí)(12個(gè)時(shí)間步長(zhǎng))交通流量預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)數(shù)值。評(píng)價(jià)指標(biāo)數(shù)值越小,代表預(yù)測(cè)誤差越小,模型交通流量預(yù)測(cè)精度越高。表3.1各個(gè)模型在PeMSD4數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果PeMSD4(15/30/60min)模型MAERMSEMAPE(%)GraphWaveNet19.23/20.44/22.3730.51/32.39/36.4612.92/14.08/15.36AGCRN18.99/20.07/22.5830.15/32.17/35.9212.69/13.43/15.27DSTGCN18.87/20.43/23.5029.98/32.07/35.9913.07/14.25/16.72ADSTGCN17.49/18.21/19.4628.77/29.98/31.7512.05/12.59/13.71表3.2各個(gè)模型在PeMSD8數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果PeMSD8(15/30/60min)模型MAERMSEMAPE(%)GraphWaveNet14.26/15.41/16.8322.72/24.46/27.499.34/9.94/11.28AGCRN14.64/15.58/17.8623.11/25.34/28.729.48/10.09/11.23DSTGCN13.97/15.08/17.2022.74/24.67/27.768.70/9.95/11.70ADSTGCN12.54/13.30/14.9521.23/22.78/24.978.49/9.01/10.04分析實(shí)驗(yàn)結(jié)果數(shù)據(jù)可以得出:(1)基于深度學(xué)習(xí)的交通流預(yù)測(cè)模型性能普遍優(yōu)于基于傳統(tǒng)時(shí)序預(yù)測(cè)方法的模型。相比于ARIMA模型和VAR模型難以捕獲到路網(wǎng)交通流量數(shù)據(jù)的復(fù)雜非線性時(shí)間關(guān)聯(lián),深度學(xué)習(xí)模型在捕獲高復(fù)雜度非線性變化特征時(shí)有明顯優(yōu)勢(shì)。隨著預(yù)測(cè)時(shí)間窗口增大,當(dāng)前時(shí)刻的輸入交通路數(shù)據(jù)與預(yù)測(cè)時(shí)間點(diǎn)的時(shí)間間隔增長(zhǎng),路網(wǎng)交通狀態(tài)會(huì)產(chǎn)生更加復(fù)雜的變化,導(dǎo)致長(zhǎng)期預(yù)測(cè)性能降低。特別從一小時(shí)預(yù)測(cè)結(jié)果看,深度學(xué)習(xí)模型明顯表現(xiàn)出更好的效果。(2)結(jié)合交通路網(wǎng)空間信息的基于圖神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)模型性能普遍優(yōu)于只針對(duì)時(shí)序特征建模的深度學(xué)習(xí)模型。同時(shí)考慮復(fù)雜時(shí)間依賴和路網(wǎng)交通空間圖結(jié)構(gòu)信息的模型如DCRNN、STGCN、ASTGCN、GraphWaveNet、AGCRN、DSTGCN預(yù)測(cè)性能普遍高于只捕獲時(shí)序關(guān)聯(lián)的LSTM模型。隨著預(yù)測(cè)時(shí)間長(zhǎng)度的增加,它們性能下降幅度也較小,夠保證有良好的性能。(3)與其余8種基線模型相比,DSTGCN在三個(gè)預(yù)測(cè)時(shí)間點(diǎn)都取得了較好的結(jié)果,能夠與現(xiàn)有最優(yōu)模型達(dá)到同一水平。隨著預(yù)測(cè)時(shí)間的跨度增加,在長(zhǎng)時(shí)間預(yù)測(cè)上性能略低于現(xiàn)有最優(yōu)模型。實(shí)驗(yàn)結(jié)果表明,DSTGCN能夠有效捕獲路網(wǎng)交通流數(shù)據(jù)的時(shí)空特征,完成交通流預(yù)測(cè)任務(wù)。3.3.6消融分析為了研究本節(jié)提出的DSTGCN模型各個(gè)組成模塊的有效性,本節(jié)通過(guò)消融實(shí)驗(yàn),移除網(wǎng)絡(luò)模型中部分結(jié)構(gòu)模塊,形成三種DSTGCN變體模型,并進(jìn)行性能評(píng)估。三種變體模型分別為:(1)DSTGCN/GT:從DSTGCN模型中移除門(mén)控時(shí)序卷積網(wǎng)絡(luò)中的門(mén)控(Gated)模塊。(2)DSTGCN/DA:從DSTGCN模型中移除解糾纏自適應(yīng)圖卷積網(wǎng)絡(luò)中的解糾纏(Disentangled)和自適應(yīng)(Adaptive)鄰接矩陣模塊。(3)DSTGCN/DW:從DSTGCN模型中移除天(Day)周期組件和周(Week)周期組件,只保留近期小時(shí)(Hour)組件。表3.3DSTGCN及其變體在PeMSD4數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表3.3展示了DSTGCN及其去除了部分結(jié)構(gòu)模塊后的變種模型在PeMSD4數(shù)據(jù)集上的一小時(shí)內(nèi)(12個(gè)時(shí)間步長(zhǎng)內(nèi))交通流量預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)數(shù)值平均值。DSTGCN相較于其變體模型,平均MAE值最大降低了1.24,平均RMSE值最大降低了2.39,平均MAPE值最大降低了0.6。由此可見(jiàn),三個(gè)模塊都有其在特征捕獲上的重要作用,DSTGCN模型的性能離不開(kāi)各個(gè)模塊的共同作用,缺一不可。如圖3.15為DSTGCN及其去除了部分結(jié)構(gòu)模塊后的變種模型在PeMSD4數(shù)據(jù)集上隨時(shí)間步長(zhǎng)變化的交通流量預(yù)測(cè)評(píng)價(jià)指標(biāo)數(shù)值圖。(a)(b)(c)圖3.15DSTGCN及其變體在PeMSD4數(shù)據(jù)集上指標(biāo)隨時(shí)間步長(zhǎng)的變化隨著時(shí)間步長(zhǎng)增加,各項(xiàng)評(píng)價(jià)指標(biāo)也不斷增大,但DSTGCN在各時(shí)間步長(zhǎng)上整體指標(biāo)均要優(yōu)于其變體模型。通過(guò)消融實(shí)驗(yàn)分析,證明了模型三個(gè)模塊的有效性。DSTGCN模型中解糾纏和自適應(yīng)鄰接矩陣圖卷積模塊對(duì)提升整體模型預(yù)測(cè)性能有較大幫助,該模塊通過(guò)將解糾纏的圖卷積運(yùn)用在可學(xué)習(xí)的帶參自適應(yīng)鄰接矩陣上,從而能夠有效捕獲交通路網(wǎng)中潛在且復(fù)雜的空間關(guān)聯(lián)并能夠更好的學(xué)習(xí)路網(wǎng)中個(gè)節(jié)點(diǎn)的空間依賴。門(mén)控時(shí)序卷積網(wǎng)絡(luò)中的門(mén)控模塊能夠通過(guò)半開(kāi)半閉的狀態(tài)控制有效信息的流入和無(wú)效信息的丟棄,有效優(yōu)化時(shí)序卷積網(wǎng)絡(luò)性能,從而提升模型捕獲交通流量數(shù)據(jù)時(shí)間特征的能力。天周期組件和周周期組件通過(guò)引入不同時(shí)間尺度輸入數(shù)據(jù),幫助模型有效捕獲較長(zhǎng)時(shí)間尺度內(nèi)存在的時(shí)空依賴,深度挖掘預(yù)測(cè)時(shí)段的交通流量與歷史交通流量之間的時(shí)空關(guān)聯(lián)。第五章總結(jié)與展望隨著各地城市化進(jìn)程的不斷推進(jìn)和城市基礎(chǔ)設(shè)施的不斷完善,智能交
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物標(biāo)志物AI輔助發(fā)現(xiàn)的監(jiān)管框架
- 生物打印技術(shù)在肝臟移植中的替代方案探索
- 銀行金融行業(yè)崗位技能測(cè)評(píng)題庫(kù)與答案解析
- 生存質(zhì)量評(píng)估工具
- 生物制藥研發(fā)員面試專(zhuān)業(yè)知識(shí)測(cè)試
- 證券從業(yè)資格考試科目重點(diǎn)突破與模擬測(cè)試含答案
- 建筑預(yù)算員工作手冊(cè)及考核題目
- 年產(chǎn)xxx塑料水表項(xiàng)目可行性分析報(bào)告
- 預(yù)約員崗位面試題庫(kù)含答案
- 程序員求職寶典常見(jiàn)面試題庫(kù)與答題策略
- 【MOOC】電子線路設(shè)計(jì)、測(cè)試與實(shí)驗(yàn)(二)-華中科技大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- DB3301∕T 65.1-2024 反恐怖防范系統(tǒng)管理規(guī)范 第1部分:通則
- 外貿(mào)企業(yè)國(guó)際市場(chǎng)開(kāi)拓方案
- DL∕T 5210.6-2019 電力建設(shè)施工質(zhì)量驗(yàn)收規(guī)程 第6部分:調(diào)整試驗(yàn)
- 高中物理學(xué)業(yè)水平測(cè)試常用公式及知識(shí)點(diǎn)
- 肝膽科學(xué)科發(fā)展規(guī)劃
- 2024年保安員資格考試初級(jí)理論知識(shí)試題庫(kù)及答案(共290題)
- 心腦血管疾病的健康管理
- 2024年浙江省大學(xué)生物理競(jìng)賽
- 普通診所污水、污物、糞便處理方案 及周邊環(huán)境情況說(shuō)明
- 國(guó)開(kāi)02150-計(jì)算機(jī)網(wǎng)絡(luò)(本)機(jī)考復(fù)習(xí)資料
評(píng)論
0/150
提交評(píng)論