基于復數(shù)浮點運算的協(xié)方差矩陣的FPGA實現(xiàn)_第1頁
基于復數(shù)浮點運算的協(xié)方差矩陣的FPGA實現(xiàn)_第2頁
基于復數(shù)浮點運算的協(xié)方差矩陣的FPGA實現(xiàn)_第3頁
基于復數(shù)浮點運算的協(xié)方差矩陣的FPGA實現(xiàn)_第4頁
基于復數(shù)浮點運算的協(xié)方差矩陣的FPGA實現(xiàn)_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、    基于復數(shù)浮點運算的協(xié)方差矩陣的FPGA實現(xiàn)O引言協(xié)方差矩陣的計算是信號處理領域的典型運算,是實現(xiàn)多級嵌套維納濾波器、空間譜估計、相干源個數(shù)估計以及仿射不變量模式識別的關鍵部分,廣泛應用于雷達、聲吶、數(shù)字圖像處理等領域。采用FPGA(FieldProgrammableGateArray)可以提高該類數(shù)字信號處理運算的實時性,是算法工程化的重要環(huán)節(jié)。但是FPGA不適宜對浮點數(shù)的處理,對復雜的不規(guī)則計算開發(fā)起來也比較困難。故目前國內(nèi)外協(xié)方差運算的FPGA實現(xiàn)都是采用定點運算方式。在充O 引言協(xié)方差矩陣的計算是信號處理領域的典型運算,是實現(xiàn)多級嵌套維納濾

2、波器、空間譜估計、相干源個數(shù)估計以及仿射不變量模式識別的關鍵部分,廣泛應用于雷達、聲吶、數(shù)字圖像處理等領域。采用FPGA(Field Programmable Gate Array)可以提高該類數(shù)字信號處理運算的實時性,是算法工程化的重要環(huán)節(jié)。但是FPGA不適宜對浮點數(shù)的處理,對復雜的不規(guī)則計算開發(fā)起來也比較困難。故目前國內(nèi)外協(xié)方差運算的FPGA實現(xiàn)都是采用定點運算方式。在充分應用FPGA并行處理能力的同時,為了擴展數(shù)據(jù)處理的動態(tài)范圍,減少數(shù)據(jù)溢出機率,避免數(shù)據(jù)截斷所產(chǎn)生的誤差,提高協(xié)方差矩陣的運算精度以及擴展該運算的通用性。     

3、0;   本文以空間譜估計作為研究背景,研究了復數(shù)據(jù)運算和浮點運算的特點,提出了一種適用于任何陣列流型、任意陣元的基于復數(shù)浮點運算的協(xié)方差矩陣的FPGA實現(xiàn)方案。1 求解復數(shù)浮點協(xié)方差矩陣以11陣元的均勻圓陣為例,其協(xié)方差矩陣的求解方案原理框圖如圖1所示。1.1 FIF0數(shù)據(jù)緩存器在該設計方案中選擇FIFO作為數(shù)據(jù)存儲器,這是因為一旦多路接收機有數(shù)據(jù)輸出,就會啟動FIFO進行存儲,進而FIFO的不空信號有效(empty=O),觸發(fā)后續(xù)的矩陣運算;否則,運算停止,一切狀態(tài)清零,F(xiàn)PGA恢復idle(空閑)狀態(tài),等待新的快拍采樣數(shù)據(jù)的到來。這樣可以很方便地控制運算的開始和結束。

4、矩陣運算所需要的同步時鐘需要設計一個類似于單穩(wěn)態(tài)觸發(fā)器的模塊。當檢測到empty=0時,就觸發(fā)一個含有121個clk(對于串行方案而言)時鐘信號周期長度的高電平。該高電平與主時鐘相與便可以得到運算的同步時鐘。1.2 數(shù)據(jù)共軛轉換由于測向陣列的輸出矢量X(t)是一個復矢量,對其求協(xié)方差矩陣需用陣列輸出列矢量X(t)與其共軛轉置矢量XH(n)對應相乘。如式(1)所示:1.3 定點數(shù)到浮點數(shù)的轉換定點計算在硬件上實現(xiàn)簡單,計算速度比浮點計算要快,但是表示操作數(shù)的動態(tài)范圍受到限制,浮點數(shù)計算硬件實現(xiàn)比較困難;一次計算花費的時間也遠大于定點計算的花費,但是其表示的操作數(shù)動態(tài)范圍大,精度高。在本設計中,考

5、慮到系統(tǒng)的數(shù)據(jù)動態(tài)范圍和運算精度,選擇浮點計算。由于運算數(shù)據(jù)是直接從接收機I,Q兩路通道的A/D變換器的輸出獲得,為定點數(shù),因此必須要有一個將A/D采樣的定點數(shù)據(jù)轉換為浮點數(shù)的過程。設計中將16位定點數(shù)轉換為IEEE 754標準的單精度格式。32位單精度格式如圖2所示,最高位為符號位,其后8位為指數(shù)e(用移碼表示,基數(shù)f=2,偏移量為127),余下的23位為尾數(shù)m。1.4 浮點復數(shù)乘累加器1.4.1 復數(shù)乘法器假設有兩個復數(shù)分別為a+jb和c+jd,這兩個數(shù)的乘積為:復數(shù)乘法器的工作原理如圖3所示,其中所用到的加法、減法和乘法器都是基于浮點的運算。值得一提的是,在實現(xiàn)浮點加減法的時候,可以將尾

6、數(shù)連同符號位轉化為變形補碼形式后再進行加減運算。這樣做的目的是方便判斷數(shù)據(jù)是否溢出(變形補碼判斷溢出的規(guī)則是:當兩位符號位不同時表示溢出,否則無溢出。無論數(shù)據(jù)是否溢出,第一位符號位永遠代表真正的符號),若溢出,則將尾數(shù)右歸,指數(shù)部分加1,若沒有溢出,則將尾數(shù)左歸(規(guī)格化)。浮點乘法相對較簡單,對應階碼相加,尾數(shù)相乘可以采用定點小數(shù)的任何一種乘法運算來完成,只是在限定只取一倍字長時,乘積的若干低位將會丟失,引入誤差。1.4.2 浮點復數(shù)乘累加器以11個陣元的圓陣為例,實現(xiàn)串行處理方案的浮點復數(shù)乘累加器的原理如圖4所示,實部和虛部(雙通道)的乘累加器模塊工作原理一樣。121階數(shù)據(jù)緩存器實際上就是1

7、21個數(shù)據(jù)鎖存器級聯(lián)形成的一個移位寄存器,初始狀態(tài)為零。當浮點復數(shù)乘法器有輸出的時候,啟動數(shù)據(jù)緩存器與之進行加法操作,121個時鐘周期以后可以實現(xiàn)一次快拍采樣的矩陣累加。累加清零信號由時序控制器給出,當所有的快拍采樣點運算都結束之后,數(shù)據(jù)緩存器輸出累加結果(即協(xié)方差矩陣的運算結果),同時控制器送出一個清零信號,清零121階數(shù)據(jù)緩存器。2 仿真結果可編程邏輯設計有許多內(nèi)在規(guī)律可循,其中一項就是面積和速度的平衡與互換原則。面積和速度是一對對立統(tǒng)一的矛盾體,要求一個設計同時具備設計面積最小,運行頻率最高,這是不現(xiàn)實的。于是基于面積優(yōu)先原則和速度優(yōu)先原則,本文分別設計了協(xié)方差矩陣的串行處理方案和并行處

8、理方案,并用AlterastratixEP1S20F780C7進行板上調(diào)試。其調(diào)試結果表明,串行處理方案占用的資源是并行處理方案的1/4,但其運算速度卻是后者的11倍。2.1 串行處理方案仿真結果如圖5所示,clk為運算的總控制時鐘;reset為復位控制信號,高電平有效;rd為讀使能信號,低電平有效;wr為寫使能信號,低電平有效;wr_clk為寫時鐘信號,上升沿觸發(fā);q_clk為讀時鐘信號,上升沿觸發(fā);ab_re(31:O)和ab_im(31:O)為乘法器輸出的實部和虛部。q_t2為矩陣乘累加模塊的同步時鐘信號;clkll,state(3:O),clkl和state(3:0)是狀態(tài)機的控制信號

9、,控制矩陣運算規(guī)則。如圖5所示,在100ns時reset信號有效(即reset=1),所有狀態(tài)清零。從335635 ns間,寫使能信號有效(wr=O)且有兩個寫時鐘信號的上升沿到來,即向任意一個通道的FIFO中存入兩個快拍采樣數(shù)據(jù),最后輸出結果應該有兩個矩陣,如圖6所示。當FIFO為空時,運算停止,所有狀態(tài)清零。等待新采樣數(shù)據(jù)的到來。圖5中,在350 ns時,讀使能有效(rd=0)且有一個讀時鐘信號的上升沿到來,所以empty信號存在短暫的不空(empty=O)狀態(tài),捕獲到這個信息,便觸發(fā)單穩(wěn)態(tài)觸發(fā)器模塊,產(chǎn)生具有121個clk時鐘周期長度,占空比為120:1的q_clk信號,進行FIFO的讀

10、操作。在350535ns時間段,因為寫時鐘信號沒有到來,所以FIFO為空(empty=1)。從550ns24.75 s時間段讀時鐘信號沒有上升沿到來,整個設計處于第一個矩陣的運算過程中,即運算一個矩陣所需要的時間為24.2 s。與此同時,第二個數(shù)據(jù)寫入FIFO,empty一直處于不空狀態(tài)(empty=O)。在第一個矩陣運算結束之后,即24.6s時,系統(tǒng)檢測到empty=0,開始讀數(shù)據(jù)并觸發(fā)第二個矩陣運算的時鐘控制信號。如圖6所示,在24.6s時,empty=1。FIFO中的第二個數(shù)據(jù)被讀出,處于空狀態(tài)。從24.8549.05s進入第二個矩陣的運算周期。在仿真時,輸人數(shù)據(jù)為16位的定點數(shù)(1+j

11、1;O+jO;2+j2;3+j3;4+j4;5+j5,6+j6;7+j7;8+j8;9+j9;A+jA),輸出結果為32位的單精度浮點數(shù)。選擇的主時鐘周期為200ns。在實際調(diào)試過程中,整個系統(tǒng)可以在50 MHz主時鐘頻率下正常工作。2.2 并行處理方案仿真結果并行方案運算原理與串行方案的一樣,只是在時鐘控制上有所區(qū)別,因為采用了11個浮點復數(shù)乘累加器,進行一次矩陣運算,只需要11個時鐘周期,如圖7,圖8所示。在仿真時,設置在寫使能信號有效(wr=O)的同時,有3個寫時鐘信號(wr_clk)的上升沿到來,即分別向22個FIF0中存入3個數(shù)據(jù),則輸出有3個矩陣。從圖7中還可以清楚地看出,運算結果是矩陣的11行數(shù)據(jù)并行輸出,輸出結果是一個對稱矩陣。3 結語在分析了目前應用于空間譜估計的協(xié)方差矩陣運算在硬件實現(xiàn)上的不足,如定點計算的數(shù)據(jù)動態(tài)范圍小,運算精度不高,且只適用于特定陣列模型和的陣元數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論