版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第1章DSP概?述1.1引言1.2什么是DSP1.3DSP處理器的特點1.4DSP處理器的應用1.5具有代表性的DSP芯片生產(chǎn)商習題與思考題
現(xiàn)代社會,數(shù)字電視、數(shù)碼相機、數(shù)字電話、數(shù)字視頻、數(shù)字音頻等產(chǎn)品已經(jīng)得到了廣泛的應用。與傳統(tǒng)的模擬產(chǎn)品比較,這些數(shù)字產(chǎn)品能夠提供更完美的效果。這在很大程度上是由于這些產(chǎn)品使用了數(shù)字信號處理技術的緣故。目前,數(shù)字信號處理任務大多數(shù)都是由DSP來完成的,DSP技術已成為人們?nèi)找骊P注的并得到迅速發(fā)展的前沿技術。1.1引言
DSP是數(shù)字信號處理(DigitalSignalProcessing)的縮寫,也是數(shù)字信號處理器(DigitalSignalProcessor)的縮寫。我們所說的DSP技術,通常指的是利用通用的或?qū)S玫腄SP處理器來完成數(shù)字信號處理的方法和技術。1.2什么是DSP1.2.1數(shù)字信號處理
數(shù)字信號處理是一種通過使用數(shù)學方法來提取信息,處理現(xiàn)實信號的信號處理技術。這些被處理的信號由數(shù)字序列表示。
1807年傅里葉分析誕生,并在隨后產(chǎn)生了兩種傅里葉分析方法,即連續(xù)的和離散的傅里葉分析,但是由于其計算量太大,很難在實際使用中發(fā)揮作用。直到1965年,IBM公司的Cooley和Tukey提出DFT(離散傅里葉變換)的高效快速算法(FourierTransform,F(xiàn)FT),才使數(shù)字信號處理方法的使用有了突破性的進展。自FFT產(chǎn)生以來,數(shù)字信號處理(DSP)已有40多年的歷史,在這期間,伴隨著計算機和信息技術的飛速發(fā)展,數(shù)字信號處理技術日臻完善,進而形成一門獨立的學科系統(tǒng)。
如今,在數(shù)字信號處理的各個應用領域,如語音與圖像處理、信息的壓縮與編碼、信號的調(diào)制與調(diào)解、信道的辨識與均衡、各種智能控制與移動通信等都延伸出各自的理論與技術,可以說凡是用計算機來處理各類信號的場合都引用了數(shù)字信號處理的基本理論、概念和技術。
經(jīng)典的數(shù)字信號處理方法有時域的信號濾波(如IIR、FIR)和頻域的頻譜分析(如FFT)。1.2.2數(shù)字信號處理器
數(shù)字信號處理器(DigitalSignalProcessors,DSP)是指具有專門為完成通用數(shù)字信號處理任務而優(yōu)化設計的系統(tǒng)體系結(jié)構、軟件和硬件資源的單片、可編程的處理器。
經(jīng)典的數(shù)字信號處理,如IIR、FIR和FFT的核心是乘加運算。數(shù)字信號處理器是專門為完成數(shù)字信號處理任務而優(yōu)化設計的,其設計的宗旨是為了更快地完成數(shù)字信號處理任務,因此其特點是更適合于乘加運算。另外,數(shù)字信號處理器是可編程的,非常利于程序修改以及產(chǎn)品升級。1.2.3數(shù)字信號處理的特點與優(yōu)勢
1.數(shù)字信號處理的優(yōu)點
1)設計靈活性
圖1-1為一個典型的FIR濾波器,同樣的濾波效果可以由傳統(tǒng)的模擬濾波器完成,但是如果需要改變設計時,模擬系統(tǒng)必須重新進行系統(tǒng)設計,至少需要改變系統(tǒng)中的某些器件或參數(shù),然后再重新裝配和調(diào)試,這個過程是非常費時和費力的。而如果使用以DSP處理器為核心的數(shù)字系統(tǒng),則是在一個硬件平臺通過用各種軟件來執(zhí)行各種各樣的數(shù)字信號處理任務。改變設計時,只需要改變相應的軟件或軟件中的參數(shù),而不需要改變硬件平臺本身,具有極大的靈活性,是傳統(tǒng)的模擬系統(tǒng)無法比擬的。例如,數(shù)字濾波器可以通過重新編程來完成低通、高通、帶通和帶阻等不同的濾波任務,不需要改變硬件;而模擬濾波器則必須改變其設計并重新調(diào)試,才能達到目的。近年來得到迅速發(fā)展和應用的軟件無線電技術,是在一個以高性能DSP處理器為核心的硬件平臺上,用不同的軟件來實現(xiàn)對不同工作模式的電臺間通信;對于模擬電臺而言,只有工作模式完全相同的電臺之間才能進行通信。
以DSP處理器為核心的數(shù)字系統(tǒng)的靈活性是模擬系統(tǒng)很難達到的,有的甚至是模擬系統(tǒng)不可能實現(xiàn)的。
圖1-1有限沖擊響應濾波器(FIR)結(jié)構圖
2)精度高
一般來說,數(shù)字系統(tǒng)精度要比模擬系統(tǒng)高。模擬系統(tǒng)由于受元器件精度的制約,精度始終很難提高,雖然現(xiàn)在有了高精度的電阻等元器件,但其直接影響了系統(tǒng)的成本,而且其精度也不能讓人滿意。而數(shù)字系統(tǒng)的精度是由系統(tǒng)所采用的A/D轉(zhuǎn)換器的位數(shù)、處理器字長以及所采用的算法等因素決定的。相對而言,可以獲得更高的精度。
3)可靠性和可重復性好
數(shù)字系統(tǒng)的可靠性和可重復性也是模擬系統(tǒng)所不能達到的。模擬系統(tǒng)受環(huán)境溫度、濕度、噪聲、電磁場等的干擾和影響大。當環(huán)境的溫度、濕度、振動以及在外界電磁場干擾等條件改變時,模擬系統(tǒng)的性能就會發(fā)生改變,而且可能是大的改變。另外,隨時間的改變,模擬系統(tǒng)的特性也會發(fā)生改變。數(shù)字系統(tǒng)的輸入、輸出是由軟件來確定的,因此,不存在隨時間而改變的問題。相對模擬系統(tǒng)而言,數(shù)字系統(tǒng)的穩(wěn)定性要好得多,即受時間和環(huán)境的影響要小得多。兩個同樣設計的模擬系統(tǒng),采用同樣的元器件,在相同的輸入信號和環(huán)境下,由于元器件參數(shù)的離散性,所得到的輸出往往會有細小的差別。另外,同一個模擬系統(tǒng)在不同的時間和環(huán)境下,相同的輸入也往往得不到相同的輸出結(jié)果。而數(shù)字系統(tǒng)一旦其設計完畢以后,精度也就確定了,并且其精度不會隨著時間和環(huán)境的變化而變化。
4)便于大規(guī)模集成
隨著科學與技術的發(fā)展,近年出現(xiàn)了大量的模擬集成電路和模擬/數(shù)字混合集成電路,但從可選擇的種類、集成度、功能與性能、性價比等諸方面而言,還是不能與超大規(guī)模數(shù)字集成電路相比。DSP處理器就是基于超大規(guī)模數(shù)字集成電路技術和計算機技術而發(fā)展起來的、適合于作數(shù)字信號處理的高速高位微處理器。它們體積小、功能強、功耗小、一致性好、使用方便、性價比高。
5)數(shù)字系統(tǒng)的其他優(yōu)勢
數(shù)字系統(tǒng)除具有上述優(yōu)勢以外,還在抗干擾性能、數(shù)據(jù)壓縮、實現(xiàn)自適應算法等方面有不俗的表現(xiàn)。
數(shù)字系統(tǒng)的抗干擾功能強大。在數(shù)字系統(tǒng)中,信號是用0和1來表征的,雖然0和1所表征的數(shù)字信號也會受到噪聲的干擾,但只要能夠正確地識別0和1,并將其再生,則可以完全消除噪聲的影響。另外,迅速發(fā)展的各種數(shù)字糾錯編解碼技術,能夠在極為復雜的噪聲環(huán)境中,甚至信號完全被噪聲所淹沒的情況下,正確地識別和恢復原有的信號。這點在模擬系統(tǒng)中是無法做到的。模擬信號進行壓縮時付出的代價是隨著帶寬的變窄,信號的質(zhì)量會受到比較大的影響。然而數(shù)字信號的壓縮可以在對原信號質(zhì)量影響很小的前提下,取得很高的壓縮比。這對數(shù)據(jù)的傳輸和存儲,無疑是很有利的。例如,采用數(shù)字電視技術以后,可以利用原有的有線電視網(wǎng)絡傳輸更多的、質(zhì)量更好的電視節(jié)目,并且可以提供諸如互動電視等更好的服務。從信號與系統(tǒng)的角度講,自適應就是使系統(tǒng)的特性隨輸入信號的改變而改變,從而在某種準則下,得到最優(yōu)的輸出。例如,IP電話中的回聲會嚴重影響服務質(zhì)量,必須加以消除。但回聲的幅度和延時量隨時都在改變,只有使用自適應系統(tǒng)才能將其消除。就模擬系統(tǒng)而言,只有改變系統(tǒng)的設計和元器件的參數(shù),才能改變系統(tǒng)的特性,因而很難實現(xiàn)實時自適應。以DSP處理器為核心的數(shù)字系統(tǒng),已經(jīng)成為實現(xiàn)各種自適應算法的首選。對于特定的自適應算法,它能根據(jù)確定的準則,實時地改變系統(tǒng)的參數(shù),從而實現(xiàn)實時自適應;對于不同的自適應算法,只需要更換適當?shù)能浖纯伞?/p>
2.模擬信號處理的不可替代性
盡管數(shù)字系統(tǒng)具有如此之多的優(yōu)越性,但仍然不能完全取代模擬系統(tǒng)。
實際上,自然界的信號絕大多數(shù)是模擬信號。如聲音、圖像、溫度、壓力、速度、加速度等信號都是隨時間連續(xù)變化的模擬信號。我們要利用數(shù)字系統(tǒng)對其進行處理,必須首先用模擬系統(tǒng)和模擬數(shù)字混合系統(tǒng)加以處理。例如用模擬濾波器將其改變成帶限信號,用模擬放大器改變其幅度,然后采樣/保持,通過A/D變換器變換成為數(shù)字信號后,才能用數(shù)字信號處理系統(tǒng)加以處理;處理之后,還要通過D/A變換器變換成為模擬信號,并通過適當?shù)哪M信號處理,才能加以使用。所以,要想構成一個完整的數(shù)字信號處理系統(tǒng),大多數(shù)情形下離不開模擬系統(tǒng)。1.2.4數(shù)字信號處理算法的特點
上面我們講到了DSP處理器是專門為數(shù)字信號處理算法而優(yōu)化設計的,那么DSP算法到底有什么特點呢?
圖1-1中有限沖擊響應濾波器(FIR)可以用下式來表示:
(1-1)
式1-1是一個一系列乘積的累加,也就是說該式使用了乘法和加法,并且做了N重的循環(huán)。
由此可以看出DSP算法是屬于數(shù)學計算,這區(qū)別于那些以數(shù)據(jù)操作為主的常規(guī)任務。數(shù)據(jù)操作的典型運用如字處理、數(shù)據(jù)庫管理、表格、操作系統(tǒng)等,其主要操作有諸如將數(shù)據(jù)B移動到數(shù)據(jù)A,檢測A是否等于B等。而數(shù)學計算的典型運用,如數(shù)字信號處理、科學和工程仿真等,其主要操作是乘法、加法等運算。1.2.5實時處理的概念
上面我們講了模擬系統(tǒng)從本質(zhì)上來說是實時的,那么,什么是實時處理呢?可以這樣說:實時的概念是根據(jù)具體的應用來確定的。
對于一個處理過程,如果滿足下式,我們可以認為處理是實時的。
等待時間≥0 (1-2)
如圖1-2所示,要使等待時間≥0,就必須使處理時間小于采樣時間,也就是說要在規(guī)定的采樣時間內(nèi)完成與之相應的數(shù)據(jù)處理。
圖1-2處理時間、采樣時間、等待時間關系圖對于圖1-1中有限沖擊響應濾波器(FIR)來說,要使其處理是實時的,就必須在采樣時間內(nèi)完成式(1-1)的計算,這樣的計算量通常來說都是相當大的。
數(shù)字信號處理器是專門為完成數(shù)字信號處理任務而優(yōu)化設計的,因此其實時處理數(shù)據(jù)的能力也是獨一無二的。1.2.6數(shù)字信號處理算法實現(xiàn)的途徑
數(shù)字信號處理的實現(xiàn)方法有多種,大體可以分為基于PC和非基于PC的兩種。
基于PC的實現(xiàn)方法可以說是通過軟件來實現(xiàn)的。例如,我們在個人電腦上常用的MP3播放器就是通過軟件來實現(xiàn)MP3格式的音頻文件解壓縮的,而這過程是通過在個人電腦上運行的軟件來實現(xiàn)的。
非基于PC的實現(xiàn)方法可以說是通過硬件來實現(xiàn)的。例如,F(xiàn)PGA(現(xiàn)場可編程門陣列)、ASIC(專用集成電路)以及專用的和通用的DSP,都可以用來實現(xiàn)DSP算法。用FPGA(現(xiàn)場可編程陣列)實現(xiàn)DSP的各種功能實質(zhì)上是采用了一種硬連接邏輯電路,但由于FPGA具有現(xiàn)場可編程能力,允許根據(jù)需要迅速重新組合基礎邏輯來滿足使用要求,因而更加靈活,而且比通用DSP芯片具有更高的速度。一些大的公司如Xilinx、Altera也正把FPGA產(chǎn)品擴展到DSP的應用中去。值得一提的是Xilinx在2004年9月成立了DSP部,2005年又加大對DSP研發(fā)的投入。
ASIC系統(tǒng)是為某種應用目的專門設計的系統(tǒng)。通常用于數(shù)字信號處理的ASIC系統(tǒng)只涉及一種或一種以上自然類型數(shù)據(jù)的處理,例如音頻、視頻、語音的壓縮和解壓、調(diào)制/解調(diào)等。其內(nèi)部由基本DSP運算單元構建,包括FIR、IIR、FFT、DCT、卷積碼的編解碼器及RS編解碼器等。其可應用于計算復雜密集、數(shù)據(jù)量、運算量都很大的場合,但成本較高。
通用可編程DSP芯片是目前使用最多的數(shù)字信號處理器件。其特點本書將予以詳細討論。
1.3.1DSP處理器的結(jié)構特點
DSP處理器是專門用來進行高速數(shù)字信號處理的微處理器,其設計的著眼點是要求速度快、處理的數(shù)據(jù)量大、效率高。它的主要結(jié)構特點如下。1.3DSP處理器的特點
1.采用哈佛(Harvard)結(jié)構和改進的哈佛結(jié)構
以奔騰為代表的通用處理器采用馮·諾依曼(VonNeumen)結(jié)構,這主要考慮到成本,其結(jié)構如圖1-3所示。在馮·諾依曼結(jié)構中,程序代碼和數(shù)據(jù)共用一個公共的存儲空間,指令、數(shù)據(jù)、地址的傳送采用同一條總線,靠指令計數(shù)來區(qū)分三者。由于取指和存取數(shù)據(jù)是在同一存取空間通過同一總線傳輸,因而指令的執(zhí)行只能是順序的,不可能重疊進行,所以無法提高運算速度。
圖1-3馮·諾依曼結(jié)構
DSP處理器幾乎毫無例外的采用哈佛結(jié)構,如圖1-4所示。哈佛結(jié)構把程序代碼和數(shù)據(jù)的存儲空間分開,并有各自的地址和數(shù)據(jù)總線,每個存儲器獨立編址,用獨立的一組程序總線和數(shù)據(jù)總線進行訪問。這樣,DSP處理器就可以并行地進行指令和數(shù)據(jù)的處理,提高了信號處理的速度。圖1-4哈佛結(jié)構為了進一步提高信號處理的效率,在哈佛結(jié)構的基礎上加以改進,使得程序代碼存儲空間與數(shù)據(jù)存儲空間之間也可以進行數(shù)據(jù)交換,則稱為改進的哈佛結(jié)構(ModifiedHarvardArchitecture)。這種結(jié)構可以并行進行數(shù)據(jù)操作,例如在做數(shù)字濾波時把系數(shù)放在程序空間,待處理的樣本數(shù)據(jù)放在數(shù)據(jù)空間,處理時可以同時提取濾波器系數(shù)和樣本進行乘法和累加操作,從而大大提高運算速度。改進的哈佛結(jié)構還可以從程序存儲區(qū)來初始化數(shù)據(jù)存儲區(qū),或把數(shù)據(jù)存儲區(qū)的內(nèi)容轉(zhuǎn)移到程序存儲區(qū),這樣可以復用存儲器,降低成本,提高存儲器使用效率。
2.多總線結(jié)構
DSP除了將數(shù)據(jù)、地址總線分開以外,還具有多條附加總線,如圖1-5所示。
例如TMS320C54X的結(jié)構中有一組程序總線,兩組讀數(shù)據(jù)總線和一組寫數(shù)據(jù)總線,這樣可以同時讀取兩組數(shù)據(jù)和存儲一組數(shù)據(jù),即同一時鐘周期內(nèi)可以執(zhí)行一條3個操作的指令。這種附加總線可擴充地址增加數(shù)據(jù)流量,提高尋址能力。圖1-5多總線結(jié)構圖
3.采用流水線操作
計算機在執(zhí)行一條指令時,要通過取指、譯碼、取數(shù)、執(zhí)行等各階段,需要若干個指令周期才能完成。流水線技術是將各指令的各個步驟重疊起來進行,雖然每條指令的執(zhí)行仍然要經(jīng)過這些步驟,需要同樣的指令周期數(shù),但是將一個指令段綜合起來看,其中每一條指令似乎都是在一個周期內(nèi)完成,可以把指令周期減到最小,增加數(shù)據(jù)吞吐量。圖1-6為流水線技術示意圖。
圖1-6流水線技術如圖1-6所示,可進一步把一條指令分解為預取指、取指、解碼、取操作數(shù)地址、取操作數(shù)和執(zhí)行等6個階段,圖中的字母分別表示:
P——預取指;F——取指令;D——碼;A——取操作數(shù)地址;R——取操作數(shù);X——執(zhí)行。
從圖1-6中我們可以看出,當?shù)谝粭l指令執(zhí)行到取指令的同時,第二條指令在預取指;當?shù)谝粭l指令執(zhí)行到解碼時,第二條指令在取指令,第三條指令在預取指;以此類推,直到第六條指令預取指時,第一條指令已經(jīng)在執(zhí)行了。對于圖中的流水線狀況,當?shù)诹鶙l指令開始時,我們就稱這個流水線滿載了。當流水線滿載以后,從圖中縱向看,似乎一條指令在一個周期內(nèi)就完成了。這有些類似我們通常見到的工廠的生產(chǎn)流水線,一條生產(chǎn)線分為很多的工序,零件進入生產(chǎn)線依次進入各道工序,當各道工序都開始工作時,成品就從生產(chǎn)線上生產(chǎn)出來了。
圖1-7直觀地給出了采用流水線技術之后,執(zhí)行同樣的指令,所需要的指令周期數(shù)較采用前得到了很大的節(jié)約。
圖1-7采用流水線技術前后的比較但是,這種流水線操作也不是十全十美的,其主要原因是,一項處理很難被分解成若干個處理規(guī)模一致、在時間上有最佳配合的流水段,因而需要用寄存器協(xié)調(diào)流水線工作。
流水線操作適用于循環(huán)操作時間足夠長或多個數(shù)據(jù)點反復執(zhí)行同一指令的情況。這是由于,流水線啟動和停止的階段是流水線逐步被填滿和出空的過程。對于一次性非重復計算,流水線不可能達到穩(wěn)態(tài),反而用主要時間做填滿和出空操作,因而是不合適的。我們從DSP算法的特點,可以看出其非常適合于流水線操作,因為其計算大多是相同的乘法或加法運算,而且循環(huán)的次數(shù)較多,流水線容易達到滿載的運行狀態(tài)。
4.硬件乘法器和高效的MAC指令
在DSP算法中大量的是乘法累加運算。通用微處理一般是通過一系列的加法來完成乘法運算的,一個乘法運算需要消耗多個周期,而DSP芯片上有硬件乘法器,使得乘法運算能夠做到一個周期內(nèi)完成,這就大大提高了DSP處理器進行DSP運算的速度。另外,DSP還具有與硬件乘法器相配合的MAC乘法累加指令。硬件乘法累加器如圖1-8所示,它可以在單周期內(nèi)取兩個操作數(shù)相乘,并將結(jié)果加載到累加器。有的DSP還具有多組MAC結(jié)構,可以并行處理。。
圖1-8硬件乘法累加器圖1-8中,在加法器方框(ADD)右邊的A、B、0分別代表有可能的加法器輸入,它們?yōu)槔奂悠鰽、累加器B及0值。從圖1-8中,我們還可以看出,由于DSP采用了哈佛結(jié)構,它可以將運算所需要的采樣值和系數(shù)分別放在數(shù)據(jù)存儲器和程序存儲器之中,這樣可以通過不同的總線將所需要的數(shù)據(jù)同時取出。
在這種布局下,DSP可以實現(xiàn)單周期的MAC指令,從而進一步提高了運算的速度。我們通常將具有硬件乘法器作為DSP區(qū)分于其他處理器的標志。
5.DSP結(jié)構上的其他特點
DSP除了具有上述的結(jié)構特點外,還有以下特點:
(1)
DSP具有獨立的傳輸總線及其控制器。DSP處理器高速處理速度必須與高速的數(shù)據(jù)訪問和傳輸相配合。并且為不影響CPU及其相關總線的工作,DSP的DMA(直接內(nèi)存存取方式:數(shù)據(jù)在內(nèi)存與I/O設備間直接進行成塊傳輸)單獨設置有傳輸總線及其控制器,因此DMA可以獨立工作。有時為了提高DSP的實時處理能力,把多個DSP組成DSP處理器陣列,并行工作,此時DMA可以作為各處理器之間進行數(shù)據(jù)傳輸?shù)闹饕ǖ馈?/p>
(2)
DSP具有專用的數(shù)據(jù)地址發(fā)生器(DAG)。在DSP運算中,存儲器的訪問具有可預測性。例如在FIR濾波中,樣本、系數(shù)都是順序訪問的,因此在DSP芯片中專門設置數(shù)據(jù)地址發(fā)生器。其實它也是一個算術邏輯運算單元ALU,具有簡單的運算能力。在通用機的CPU中,數(shù)據(jù)地址和數(shù)據(jù)處理都由同一ALU完成。例如在8086中,做一次加法需要三個周期,而計算一次地址需要5~6周期,這樣會耗費大量的時間,在DSP芯片中就不需要這樣的額外開銷。另外在DSP芯片的數(shù)據(jù)地址產(chǎn)生中還支持間接尋址、循環(huán)尋址、倒位尋址等特殊操作,以適應DSP運算的各種尋址需求。
(3)
DSP具有豐富的外設(Peripherals)。DSP處理器往往是脫機獨立工作的,因此為與外設接口方便,往往設置了豐富的周邊接口電路。一般包含如下片上外設:時鐘產(chǎn)生器(振蕩器與鎖相環(huán)PLL)、定時器(Timer)、軟件可編程等待狀態(tài)發(fā)生器(以便使較快的片內(nèi)設施與較慢的片外電路及存儲器協(xié)調(diào)工作)、通用的I/O口、多通道同步緩沖串口(McBSP)和異步串口、主機接口(HIP)、JTAG邊界掃描邏輯電路(IEEE標準1149.1)(便于對DSP處理器做片上在線仿真和多處理器情況下的調(diào)試)。
(4)
DSP具有片內(nèi)存儲器。DSP芯片片內(nèi)一般帶有存放程序的只讀存儲器ROM和存放數(shù)據(jù)的隨機存儲器RAM,符合DSP運算簡單、核心程序短小的特征,同時可以提高指令傳輸效率,減小總線接口壓力。這些片存儲器不存在與外部總線競爭和訪問外部存儲器速度不匹配的問題,這樣使DSP處理器具有強大的數(shù)據(jù)處理能力。
(5)
DSP具有與結(jié)構相配合的RISC指令集。一般DSP處理器具有高度專門化、復雜且不規(guī)則的指令集,這樣單個指令字可以同時控制片內(nèi)多個功能單元操作。DSP處理器指令集在設計時有兩個特點:一是最大限度地使用了處理器的硬件資源,在單個指令中并行完成若干操作,例如在完成主要算術運算的同時,并行地從存儲器提取一個或兩個數(shù)據(jù)以及完成地址指針的更新;其次是指令所使用的存儲空間縮減到最小,為縮短指令字長,往往用狀態(tài)寄存器的模式來控制處理器的操作特性,例如舍入或飽和的處理,不再將這些信息作為指令的一部分來處理。綜上所述,DSP處理器實現(xiàn)高速運算的主要途徑可以概括為:硬件乘法器及乘-加單元、高效的存儲器訪問、零開銷循環(huán)、專門的適應硬件結(jié)構的指令集、多執(zhí)行單元、數(shù)據(jù)流的線性I/O口。1.3.2DSP與MCU、GPP的區(qū)別及其優(yōu)勢
微處理器自誕生以來,就沿著GPP(GeneralPurposeProcessor)即通常所說的通用CPU,以微機中Intel公司的奔騰系列CPU為代表、微控制器(MCU,即通常所說的單片機)以及DSP三個方向發(fā)展。MCU集成了片上外圍器件,適合不同信息源的多種數(shù)據(jù)的處理診斷和運算,側(cè)重于控制,速度并不如DSP;GPP不帶外圍器件(例如存儲器陣列),是高度集成的通用結(jié)構的處理器,是去除了集成外設的MCU;DSP運算能力強,擅長很多的重復數(shù)據(jù)運算。這三類處理器各有專長,雖然隨著技術的發(fā)展,這三類處理器之間互相借鑒,并有融合的趨勢,但總的來說,它們各自有不同的應用領域。
1.與GPP相比DSP具有的優(yōu)勢
上文講到了DSP算法的實現(xiàn)方式,其中有基于PC的實現(xiàn)方式,也就是利用軟件來實現(xiàn)?,F(xiàn)在的GPP速度越來越快,在實現(xiàn)DSP算法時可能并不比DSP慢,那么為什么大多數(shù)的DSP算法的實現(xiàn)是由DSP來完成的呢?我們從以下幾點來考慮這個問題。首先,在功耗方面,奔騰系列CPU的功耗多在20~100W,PowerPC的功耗最小也要5~10W,而DSP可以做到1~2W。如TMS320C54X是目前普遍使用的定點DSP芯片,當它的速度在100MIPS(MIPS:每秒執(zhí)行的百萬指令數(shù),是處理器速度的重要指標之一)時其功耗為60mW,而本書重點講述的TMS320C55X的功耗更低,一般工作狀態(tài)下平均功耗在20mW左右,最低可至0.33mA/MHz的超低功耗,為節(jié)能型便攜式系統(tǒng)提供了令人難以置信的潛能。其次,采用GPP來設計系統(tǒng)比采用DSP的花費更多。就單個的芯片而言,GPP的價格一般來說都比DSP要貴的多,現(xiàn)在市場上GPP的價格在幾百元人民幣到上千元不等,而普通的DSP價格一般在100元人民幣左右。另外,使用GPP來開發(fā),其開發(fā)費用高,上市的周期長,而使用DSP開發(fā)則與之相反。
最后,DSP的尺寸比GPP要小得多,更適用于便攜產(chǎn)品。我們只要看一下PC機和數(shù)碼相機的大小便可以直觀的知道兩者之間的差距了,很難想象我們會使用一臺PC機大小的數(shù)碼相機。DSP的尺寸有越來越小的趨勢,并且隨著設備不斷變小,速度越來越快,便攜性越來越高的情況下,此趨勢會繼續(xù)發(fā)展。由上可知,如果設計的系統(tǒng)或裝置需要低成本、小尺寸、低功耗并且對信號處理的實時性要求很高時,我們使用DSP來進行開發(fā)。如果需要更大的存儲空間、更高級的操作系統(tǒng)支持的時候,我們采用GPP來進行開發(fā)。
2.MCU與DSP的比較
MCU區(qū)別于DSP的最大特點在于它的通用性,反映在指令集和尋址模式中。與MCU相比,DSP實時處理要求必須滿足大數(shù)據(jù)量、復雜計算、實時性強的各種運算。
DSP在運算能力上進行了擴充,它采用專用的硬件乘法器,有足夠的字長,乘法結(jié)果保留全部數(shù)值,用雙字長乘法存儲器,同時可以用來做雙精度運算。另外,如上文所述,DSP能自動產(chǎn)生數(shù)據(jù)地址;指令時序的產(chǎn)生不對其他運算單元造成額外開銷;一般DSP芯片中都有桶形移位器,可以在一定范圍內(nèi)調(diào)整數(shù)據(jù)輸出寬度,特別是在做浮點和塊浮點運算時,免去主處理器作多次移位和旋轉(zhuǎn)操作。
DSP與MCU的結(jié)合是數(shù)字信號控制器(DSC),它終將取代這兩種芯片。數(shù)字信號控制器(DSC)是一種集微控制器(MCU)和數(shù)字信號處理器(DSP)專長于一身的新型處理器。與MCU一樣,DSC具有快速中斷響應、提供面向控制的外設(如脈寬調(diào)制器和看門狗定時器)、用C編程等特性。DSC還集成了諸如單周期乘累加(MAC)單元、桶形移位器(barrelshifter)和大的累加器等功能。1.3.3DSP處理器性能指標
一般,對DSP處理器缺乏一種諸如對PC機那樣公正合理的性能評價體系,這是由于各DSP廠商推出的產(chǎn)品在結(jié)構和數(shù)據(jù)傳輸能力上有很大的差異,DSP產(chǎn)品都是專門為某種目的而設計的,因而正確評價只有與特定的應用聯(lián)系起來,評價結(jié)果才有意義。這里將常用的指標做一介紹。
(1)
MIPS(MillionsofInstructionsPerSecond),每秒執(zhí)行百萬指令數(shù)。一般DSP為100MIPS,TI公司的5000系列性能最高可達900MIPS,使用超長指令字的TMS320B2XX為2400MIPS。
(2)
MOPS(MillionsofOperationsPerSecond),每秒執(zhí)行百萬操作數(shù)。這個指標的問題是什么是一次操作。通常操作包括CPU操作外,還包括地址計算、DMA訪問數(shù)據(jù)傳輸、I/O操作等。一般說MOPS越高意味著乘積-累加和運算速度越快。
(3)
MFLOPS(MillionFloatingPointOperationsPerSecond)。這是衡量浮點DSP芯片的重要指標。例如TMS320C31在主頻為40MHz時,處理能力為40MFLOPS,TMS320C6701在指令周期為6ns時,單精度運算可達GFLOPS。
(4)
MBPS(MillionBitPerSecond)。它是對總線和I/O口數(shù)據(jù)吞吐率的度量,也就是某個總線或I/O的帶寬。例如對TMS320C6XXX在200MHz時鐘、32bit總線時,總線數(shù)據(jù)吞吐率為6400MBPS。
(5)
MACS(Multiply-AccumulatesPerSecond)。例如TMS320C6XXX乘加速度達300~600MMACS。
以上傳統(tǒng)指標雖然可以作為設計時可選的參考指標,但是有很大的局限性。例如它沒有考慮存儲器的使用和器件的功耗,一旦器件與外部速度較慢的存儲器進行數(shù)據(jù)交換時,運行速度馬上就會降低。另一評價指標是核心算法評價指標。它是利用構成大多數(shù)DSP系統(tǒng)的基本運算模塊(例如FIR、IIR、FFT、向量加等典型運算)來進行評價的。在規(guī)定大小適度、輸入、輸出要求統(tǒng)一,保證功能一致性的條件下,也允許程序員針對所使用的處理進行代碼的優(yōu)化。評價指標是執(zhí)行時間、存儲器的使用和能耗等。
DSP處理器還有其他評估指標,各類評估指標之間都有其自身的不足,因而正確的選用器件要根據(jù)任務需要量身定做,不可一味追求某項高指標,要根據(jù)性價比合理選用器件。
由于超大規(guī)模集成電路技術的迅猛發(fā)展,DSP技術也得到了突飛猛進的發(fā)展。成本降低,促使了其需求的上升和應用領域的擴展。目前,DSP在計算機、通信、消費類電子產(chǎn)品方面(即所謂3C領域)得到了廣泛的應用。DSP在通信領域應用占72%,計算機占3%,消費類、辦公自動化各占2%,從趨勢上看,工業(yè)(特別是變頻電機控制)中的應用,以及消費類產(chǎn)品中應用的份額會有所上升。下面就DSP的幾個與我們?nèi)粘I钕嚓P的典型應用做一簡單介紹。1.4DSP處理器的應用
1.數(shù)字視頻
DSP在數(shù)字視頻領域從基礎設備到客戶端,以及便攜式設備中都得到廣泛應用。在諸如DVD、數(shù)碼相機、數(shù)字攝像機、便攜式媒體播放器(PMP)、數(shù)字機頂盒、流媒體、監(jiān)視IP視頻節(jié)點、基于IP的視頻會議終端等應用上,DSP大有用武之地。特別是TI公司推出的DaVinci技術使手持、家庭以及車載數(shù)字媒體設備方面的突破性創(chuàng)新成為可能。DaVinci專門針對數(shù)字視頻系統(tǒng)進行了優(yōu)化,并集成了基于數(shù)字信號處理器(DSP)的片上系統(tǒng)(SoC)、多媒體編解碼器、ASP和框架以及開發(fā)工具。這些集成組件提供了一套完整的開放平臺解決方案?,F(xiàn)在,開發(fā)者可以創(chuàng)建具有豐富特性的獨特設備,并針對特定應用進行優(yōu)化,從而快速投入市場。
2.電信
電信應用要求具有操作各種各樣的數(shù)據(jù)、語音、電話和連接功能的處理能力。使用可編程DSP,開發(fā)者可以輕松地擴展產(chǎn)品功能和特性集來匹配設計要求。此外,開發(fā)者可以自定義、改編以及擴充基于DSP的設計,以滿足特定的要求并集中于終端產(chǎn)品個性化。DSP的解決方案可以供遠程數(shù)據(jù)收集、因特網(wǎng)連接、電話協(xié)處理以及語音頻帶處理客戶端電話等使用。其中數(shù)字移動電話是DSP最為重要的應用領域。由于DSP具有強大的計算能力,使得移動通信的蜂窩電話重新崛起,并創(chuàng)造了一批諸如GSM、CDMA等全數(shù)字蜂窩電話網(wǎng)。由于采用DSP技術,移動電話的更新?lián)Q代變得更為容易,只需在統(tǒng)一的硬件平臺基礎上,通過軟件的不斷升級就可以生產(chǎn)出各式各樣的新款手機。
3.安防
通過使用DSP技術,可以將只有人類可以理解的模擬視頻輸入轉(zhuǎn)換為計算機可以理解的0和1的數(shù)字流。通過選擇處理空間超過轉(zhuǎn)換模擬視頻信號所需的DSP,就有可能創(chuàng)造具備領先功能的可編程智能產(chǎn)品,從而真正使產(chǎn)品具有特色并獲得未來證明。換句話說,攝像機不再局限于記錄事件。通過DSP技術,它們現(xiàn)在可以評估事件的重要性和相關性,而無需人員干預。提高效率的方法之一是讓攝像機評估事件且僅在事件確實重要的情況下才觸發(fā)警報:通過移動檢測機制,智能攝像機可以實時跟蹤運動;通過限制關注范圍,攝像機可以確定移動是發(fā)生在安全門附近(從而指示一個事件)還是在街道對面(因為不是關注點,從而也不是一個事件);攝像機可以利用對象識別來評估是重要事件(對象是一個人)還是錯誤警報(對象是一只鳥或狗);通過面部識別技術,攝像機可以驗證人員身份。此時,僅當具有足夠證據(jù)表明事件是相關的且可能非常重要時,攝像機才會觸發(fā)警報以告知人員。
4.生物辨識
生物辨識一般是指指紋匹配、面部識別和虹膜掃描等技術。每種技術的識別系統(tǒng)都使用傳感器收集圖像(指紋、面部或虹膜圖像),然后將它們與注冊用戶的數(shù)據(jù)庫中的數(shù)據(jù)進行匹配。
識別準確度是許多因素的綜合,但其中最重要的是圖像質(zhì)量。如果噪聲和人為因素使關鍵的詳細信息(例如用于模型匹配的關鍵指紋細節(jié))模糊不清,則嘗試將一個圖像與用戶數(shù)據(jù)庫進行匹配就變得非常困難。因此,圖像質(zhì)量就非常重要。DSP可以降低圖像的噪聲,進行圖像清理并且可以為掃描儀提高一個具有快速內(nèi)存結(jié)構的強大處理器,以實時地完成所需要的處理。
5.控制
DSP可以提供較MCU而言更快的執(zhí)行速度,從而達到更高的控制性能,且DSP片上集成的外設豐富、便于設計、控制精度高,因此越來越多地應用于控制領域,其主要用于磁盤控制、激光打印機控制、電機控制、發(fā)動機控制、機器人控制等場合。
1.?TI公司
TI(TexasInstruments)公司的DSP市場占有率最高,大概每2個數(shù)字蜂窩電話中就有1個采用TI產(chǎn)品,全世界90%的硬盤和33%的Modem均采用TI的DSP技術。1997年,TI公司的兩項重大投資項目令其霸主地位更加穩(wěn)固不可動搖:一是設立1億美元的風險基金,支持那些需要啟動資金的DSP應用企業(yè),為掀起DSP的應用高潮打下堅實的基礎;1.5具有代表性的DSP芯片生產(chǎn)商二是啟動500萬美元的全球大學科研基金,用于支持各高校的DSP教育,TI已在中國國內(nèi)幾十所大學建立了DSP實驗室和技術中心。
TI公司DSP目前廣泛應用的有TMS320C2000系列、TMS320C5000系列和TMS320C6000系列。
TMS320C2000系列主要用于控制系統(tǒng),因為它的資源非常豐富,在控制系統(tǒng)中需用到的一些外設該系列均在片內(nèi)集成了。TMS320C5000系列主要用于數(shù)字信號的算法處理,如FIR、IIR、FFT等。TMS320C5000系列的DSP的速度比TMS320C2000快,TMS320C2407最快只能到40MHz,TMS320C5410可以達到160MHz。目前,該系列主要用來做數(shù)字信號方面的處理以及簡單的靜態(tài)圖像處理等這樣一些資源需要處于中等的算法。TMS320C6000系列主要是用在實時圖像處理方面,更側(cè)重于算法處理。
TMS320C2000系列DSP定位于控制優(yōu)化的DSP,其融合了微控制器(MCU)的控制外設集成功能和易用性,以及TI領先的DSP技術處理能力和C編程效率。所有C28X控制器所運行的程序是相互兼容的。所有C28X控制器都能提供12位高速模數(shù)轉(zhuǎn)換器和高級PWM發(fā)生器。TMS320C2000系列DSP主要應用于硬盤控制、采暖控制、通風空調(diào)控制、電機控制、家用電器以及變頻電源控制。TMS320C2000系列DSP的主要代表產(chǎn)品如下:●
TMS320F283XX浮點控制器:業(yè)界首款浮點數(shù)字信號控制器,工作頻率高達150MHz,并可提供300MFLOPS的處理速度和512KB的片上閃存。
●
TMS320F282X控制器:這些定點32位控制器可與F283XX浮點控制器100%兼容。F282XX與F283XX具有相同的特性集和引腳至引腳兼容性,而且完全與F283XX系列軟件兼容。
●
TMS320F281X控制器:定點32位控制器,具有高達256KB的閃存和150MIPS的性能,同樣提供引腳兼容的ROM和RAM特有版本?!?/p>
TMS320F280XX控制器:定點32位控制器,采用100引腳封裝,具有高達256KB的閃存和100MIPS的性能。F280XX系列有12款產(chǎn)品,它們?nèi)慷家_至引腳兼容。
●
TMS320LF240X控制器:較舊的16位控制器,提供40MIPS的性能以及高度集成的閃存、控制和通信外設。其起價低于2美元,還提供了引腳兼容的ROM版本。
TMS320C5000系列DSP定位于高效能的DSP。
現(xiàn)在TMS320C5000DSP平臺已進行優(yōu)化,適合于消費類數(shù)字產(chǎn)品市場及通信電子產(chǎn)品。TM
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 子壩專項施工方案
- 供水水平定向鉆施工技術方案
- 2025年巫溪縣幼兒園教師招教考試備考題庫含答案解析(必刷)
- 2026年云南省麗江地區(qū)單招職業(yè)適應性測試題庫附答案解析
- 2025年遼寧生態(tài)工程職業(yè)學院單招職業(yè)傾向性測試題庫附答案解析
- 施工環(huán)境恢復驗收方案
- 房屋隔熱材料選用方案
- 農(nóng)田農(nóng)業(yè)生產(chǎn)廢棄物回收利用方案
- 商務溝通與談判實戰(zhàn)方案
- 橋梁施工材料試驗檢驗方案
- GB/T 4605-2025滾動軸承推力滾針和保持架組件及推力墊圈
- 景區(qū)旅游基礎設施提升項目可行性研究報告
- 老年機構養(yǎng)老心理健康評估方案
- 港澳聯(lián)考中文真題及答案
- 統(tǒng)編版語文四年級下冊全冊教案(2025年2月修訂)
- GB 11174-2025液化石油氣
- 肝素鈉工藝流程
- 熱工儀表工試題全集
- 2025-2030老年婚戀市場需求分析與服務平臺優(yōu)化方向
- 《JJG 875-2019數(shù)字壓力計》解讀
- 急性發(fā)熱課件
評論
0/150
提交評論