論文:并行計(jì)算方法與應(yīng)用_第1頁(yè)
論文:并行計(jì)算方法與應(yīng)用_第2頁(yè)
論文:并行計(jì)算方法與應(yīng)用_第3頁(yè)
論文:并行計(jì)算方法與應(yīng)用_第4頁(yè)
論文:并行計(jì)算方法與應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

文章編號(hào):1007-9416(2014)NVIDIA將其GPU大規(guī)模投入科學(xué)計(jì)算領(lǐng)域時(shí),提出CUDA編程模型以輔助編程人員控制任務(wù)在CPU-GPU異構(gòu)并行系統(tǒng)的分解與計(jì)算。分為三步:①CPU將原始數(shù)據(jù)經(jīng)PCI-E總線(xiàn)拷貝至GPU;②數(shù)據(jù)在GPU上進(jìn)行加速處理;③處理結(jié)果再由PCI-E總線(xiàn)拷貝回CPU。使用OpenCL編程,可以實(shí)現(xiàn)可在不同平臺(tái)上移植的并行加速代碼,如設(shè)計(jì)同一OpenCLGPU程序可適用于AMDGPU、NVIDIAGPU。傳輸系統(tǒng)識(shí)別是衛(wèi)星通信偵察中的重要環(huán)節(jié),以VSAT通信目標(biāo)系統(tǒng)識(shí)別為例,通過(guò)采用已知傳輸系統(tǒng)特征字(譬如有LinkWay、LinkWayS2、LinkStar和SkyWan等四種傳輸系統(tǒng)特征字)匹配信號(hào)至碼流文件末仍未判別成功,則視其為未知傳輸系統(tǒng)。特征字匹配過(guò)程并非大規(guī)模數(shù)據(jù)計(jì)算模塊,而不同傳輸系統(tǒng)的特使用MPI進(jìn)行并發(fā)式設(shè)計(jì):創(chuàng)建四個(gè)MPI進(jìn)程,每個(gè)進(jìn)程負(fù)責(zé)一種傳輸系統(tǒng)特征字的匹配;同時(shí),運(yùn)用MPIAbort()接口,在某一進(jìn)程判別成功后,可調(diào)用該接口以終結(jié)所有MPI進(jìn)程。原串行識(shí)別與MPI該VSAT通信目標(biāo)系統(tǒng)識(shí)別算法由其特性所限,并GPU上使用CUDA技術(shù)進(jìn)行并行開(kāi)發(fā),并且MPI并發(fā)程序設(shè)計(jì)相對(duì)CUDA更程后進(jìn)程間的通信問(wèn)題,不可避免地產(chǎn)生了通信開(kāi)銷(xiāo),導(dǎo)致實(shí)際加速表中,"第n組10000字節(jié)"項(xiàng)是指使用已知傳輸系統(tǒng)特征字在匹配碼流文件中第n組10000字節(jié)數(shù)據(jù)時(shí),得到匹配成功結(jié)果,即識(shí)別出其所屬的傳輸系統(tǒng)。合并DFT運(yùn)算中的某些項(xiàng),將長(zhǎng)序列DFT轉(zhuǎn)換為短序列DFT,從而減和頻率抽選法(DFT,Decimation-In-Frequency)兩類(lèi),本文選擇DIT方法進(jìn)行并行化設(shè)計(jì)。DIT-FFT將計(jì)算最終表示為若干個(gè)蝶形運(yùn)算,見(jiàn)圖3所示,假設(shè)進(jìn)行N點(diǎn)FFT,其中N=2M,則共有M級(jí)蝶形,每級(jí)N/2個(gè)蝶形,每個(gè)蝶形有1次復(fù)數(shù)乘法,2次復(fù)數(shù)加法,最終將運(yùn)算量縮小了2N/log2NDIT-FFT可采用原位計(jì)算思想,即每一級(jí)蝶形運(yùn)算中,每個(gè)蝶形的兩個(gè)輸入數(shù)據(jù)只對(duì)計(jì)算本蝶形有用,與其它蝶形形因子運(yùn)算獨(dú)立性,可將每個(gè)蝶形運(yùn)算(兩個(gè)點(diǎn)的FFT)賦予一個(gè)線(xiàn)程執(zhí)行。片上存儲(chǔ)(共享內(nèi)存)空間所限,需將一維FFT點(diǎn)抽象為二維矩陣形所設(shè)計(jì)并發(fā)程序理論上最多可計(jì)算256M個(gè)點(diǎn)的FFT,但由于GPU而AMDRadeonE6760GPU最多可計(jì)算32M個(gè)點(diǎn)的FFT。其與C串行時(shí)4結(jié)語(yǔ)本文以特征匹配識(shí)別算法和FFT計(jì)算為例,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論