基于DSP算法的正向設(shè)計方法學(xué)概論論文
摘要:基于DSP算法的正向設(shè)計方法學(xué)為系統(tǒng)芯片設(shè)計師提供重要的學(xué)術(shù)素養(yǎng)。本文結(jié)合圖表概論正向設(shè)計方法學(xué)中的數(shù)學(xué)變換思想,一是DSP算法變換,二是相應(yīng)的ULSI架構(gòu)變換。研究結(jié)論是作為技術(shù)核心的DSP—ULSI最佳映射,貢獻首先來自DSP算法變換,其次來自ULSI架構(gòu)變換,此間始終構(gòu)造把握評價函數(shù)。
航天、醫(yī)療和安全業(yè)界的問題牽引,驅(qū)動數(shù)字信號處理(DSP)走過經(jīng)典與現(xiàn)代,奔向智能計算與實時測控的融合,進而日益增強著DSP算法的時間和空間復(fù)雜性,迫使ULSI規(guī)模的ASIC架構(gòu)優(yōu)化,演進為由DSP算法驅(qū)動的正向設(shè)計方法學(xué)。
我們以DSP算法驅(qū)動ULSI—ASIC架構(gòu)優(yōu)化的正向設(shè)計環(huán)路為背景,以4種DSP算法變換和8種ULSI基本架構(gòu)為路標,概論DSP算法優(yōu)化和ULSI架構(gòu)優(yōu)化方法。
第一節(jié)正向設(shè)計優(yōu)化介紹設(shè)計思想和典型概念,包括映射評價、DSP算法和ULSI架構(gòu)。
第二節(jié)DSP算法變換介紹四種算法變換中的兩種,包括坐標旋轉(zhuǎn)和分布計算。
第三節(jié)介紹ULSI架構(gòu)變換,總結(jié)出八種典型變換方法,重點介紹其中的管線和并行。
1正向設(shè)計優(yōu)化
自頂向下的正向設(shè)計,在每個階段都要重視映射評價,設(shè)計的開始要繼承一些逆向設(shè)計思維。此間每一次向下映射的貢獻,首先來自DSP算法變換,其次來自ULSI架構(gòu)變換。
正向設(shè)計的競爭力,首先來自10—20萬片以上的ULSI規(guī)模ASIC的牽引,其次來自數(shù)學(xué)技巧的合理應(yīng)用,同時要重視EDA工具的熟練使用和升級培訓(xùn)。
我們將DSP算法驅(qū)動ULSI—ASIC架構(gòu)優(yōu)化的正向設(shè)計環(huán)路概括成圖1。
1。1映射評價
運作ASIC正向設(shè)計流程,其間每一次向下的階段性設(shè)計環(huán)節(jié),都可以概括入映射這個概念。映射的數(shù)學(xué)本質(zhì)就是變換。
指導(dǎo)映射的評價函數(shù)的一般構(gòu)造方法是:巧妙組合所映射的下一層中的關(guān)鍵技術(shù)指標,構(gòu)造生成一個單調(diào)變化的新參數(shù),此為評價函數(shù)。
重視以評價函數(shù)尋優(yōu)的引導(dǎo)地位,我們用圖2來概括正向設(shè)計中的關(guān)鍵知識模塊。從圖2可以清楚地看出:問題建模的作用類似大腦;算法優(yōu)化的作用優(yōu)于架構(gòu)優(yōu)化的作用;設(shè)計工程師不但應(yīng)該諳熟主流正向設(shè)計工具,更應(yīng)該以評價函數(shù)為基礎(chǔ)(或者稱為有色眼鏡),從DSP算法切入,抓住算法A(Algorithm),直奔算法集成電路ASIC的ULSI架構(gòu)優(yōu)化主題。
1。2DSP算法
算法定義為將一組數(shù)據(jù)變換到另外一組數(shù)據(jù)的方法。DSP算法的基本內(nèi)容是變換和濾波。其研究意義在于信息處理、識別和挖掘。
DSP典型算法:相關(guān),卷積,濾波,運動估值(ME),離散余弦變換(DCT),矢量量化(VQ),動態(tài)規(guī)劃,抽取和插值,小波,等等。
DSP算法優(yōu)點:區(qū)別于模擬信號處理ASP(例,譜分析精度:模擬法為10Hz;數(shù)字法為0。01Hz),魯棒性表現(xiàn)于溫漂和工藝,字長控制精度,本質(zhì)無誤差(放大信號同時消噪);區(qū)別于其他通用計算,需要實時吞吐率(采樣率),且由數(shù)據(jù)驅(qū)動。
DSP算法運算:乘積,加法,延遲(寄存)。基本公式為積和運算:Yn=∑i=0maiXn—i。
DSP算法圖示:四種框圖包括,信號流圖SFG(可轉(zhuǎn)置,僅描述線性單速率DSP系統(tǒng)),數(shù)據(jù)流圖DFG(可變換,更接近實際架構(gòu),調(diào)度并發(fā)實現(xiàn)至并發(fā)硬件),依賴圖DG(展示并行和數(shù)據(jù)流,可變換,描述脈動陣列);框圖的圖示意義是,展示并行性和數(shù)據(jù)驅(qū)動,展示時間折中和空間折中,啟發(fā)探索架構(gòu)選擇(通過算法變換)。
DSP算法實現(xiàn):CPU(單,雙,多),DSP(基于一種RISC),ULSI—ASIC(由DSP算法變換映射ULSI架構(gòu)變換和優(yōu)化),F(xiàn)PGA(算法變換,可編程,中等顆粒),CPLD(可編程,大顆粒)。
DSP集成指標:空間和面積,吞吐率和鐘頻,功耗,量化噪聲和舍入噪聲。
DSP研究思路:DSP算法變換和優(yōu)化,ULSI架構(gòu)變換和優(yōu)化,DSP算法變換與ULSI架構(gòu)變換聯(lián)合優(yōu)化;除特別指明應(yīng)用于FPGA之外,其余均聚焦服務(wù)于ULSI—ASIC優(yōu)化設(shè)計。
1。3ULSI架構(gòu)
ULSI架構(gòu)這一概念的提法,可以認為模仿了計算機組成架構(gòu)的分析理念。
ULSI架構(gòu)主要描述ASIC的內(nèi)部電路模塊,是以怎樣關(guān)聯(lián)著的平面結(jié)構(gòu)網(wǎng)絡(luò)擺在管芯之中的,其形狀類似于建筑物的平面圖紙。
我們較早熟悉的是圍繞單CPU(核)所構(gòu)建的ASIC的內(nèi)部平面網(wǎng)絡(luò)。
我們應(yīng)該熟悉的是ASIC內(nèi)部網(wǎng)絡(luò)必須是和諧的,包括數(shù)據(jù)流、控制流和關(guān)鍵存儲體的良性互動。
未來將面臨的是由二維架構(gòu)升格為三維架構(gòu)。
2DSP算法變換
各種DSP算法的本質(zhì)是積和(SoP)公式變形,構(gòu)造方法是系數(shù)縮放、變量擴增、變量平移、積和擴增、積和映射以及各種方法的組合等等。例如,自相關(guān)(麻省理工,1951年)基于變量平移和變量擴增。
林林點點的快速DSP算法,借助于公式和數(shù)學(xué)定理進行化簡和逼近,分解要點是基于子運算、重復(fù)性、規(guī)律性和并行性,熱衷于以和代積。例如,F(xiàn)FT算法(CooleyandTukey,1965年)巧妙利用了DFT變換中旋轉(zhuǎn)因子W的.周期性和對稱性。
揭示DSP算法錘煉設(shè)計和ULSI集成架構(gòu)實現(xiàn)之間的關(guān)系,認真分析特定算法的內(nèi)在特征(并行性、模塊性和信號流機制),構(gòu)造評價函數(shù),靈巧嘗試算法變換,尋優(yōu)DSP算法使之并行化、模塊化和層次化,降低其時間和空間復(fù)雜度,從而提速降耗。此間的典型數(shù)學(xué)技巧已概括入表1。
2。1坐標旋轉(zhuǎn)
1956年至1971年,采用坐標旋轉(zhuǎn)的算法得到開發(fā)和統(tǒng)一。該算法的基礎(chǔ)是在直角坐標(1619年,笛卡爾)和極坐標(1691年,伯努利)中做坐標旋轉(zhuǎn),根據(jù)被計算函數(shù)的特點選取兩種坐標系之一。來自坐標變換發(fā)明者本人的研究聲音是:在變換過的坐標系中,某些特殊函數(shù)的運算得以強力簡化。
坐標旋轉(zhuǎn)算法對應(yīng)的架構(gòu),只需加法、移位和迭代等基本操作,無需乘除運算。DSP算法基于坐標旋轉(zhuǎn)易于組合出創(chuàng)新架構(gòu)。
2。2分布計算
概念:分布計算(Croisier,1973年)是算法變換優(yōu)化的經(jīng)典范例,用于設(shè)計矢量乘法元架構(gòu)。
方法:矢量經(jīng)由二進制編碼,內(nèi)積重新排序與混合,基于查找表(LUT)實現(xiàn)與乘數(shù)無關(guān),結(jié)果使乘法運算“分布”成讀ROM且加權(quán)累加。
用途:卷積和DCT的實現(xiàn)。
如果說地位重要的DSP算法變換,其數(shù)學(xué)技巧具有發(fā)散的性質(zhì),那么,ULSI架構(gòu)優(yōu)化的變換技巧則有規(guī)律可循。
3ULSI架構(gòu)優(yōu)化
實際需求的DSP的吞吐率(采樣率)與計算能力及性能之間存在兩條鴻溝,基于架構(gòu)(包括可重構(gòu))是重要解決方案。因此,DSP算法變形(逼近)優(yōu)化在先,然后直接或組合映射ULSI架構(gòu)。評價標準可參考ULSI架構(gòu)全局模型的三要素:網(wǎng)絡(luò)幾何結(jié)構(gòu)G,處理單元F,網(wǎng)絡(luò)定時T。
優(yōu)秀的DSP算法適配到合理的ULSI架構(gòu),是創(chuàng)新過程,通用法則急需總結(jié)。應(yīng)特別注意:DSP算法得以ULSI實現(xiàn)的有效性,決定于算法內(nèi)部數(shù)據(jù)流的復(fù)雜性。
已知DSP算法,基于DSP積、和的元架構(gòu),設(shè)計ULSI系列高層次架構(gòu)的方法,可概論為以下8種,其特點列于表2。
3。1管線(流水線)
意義:縮短關(guān)鍵路徑,提速降耗;管線即流水線。
本質(zhì):時間并行處理,方法是流水線鎖存器插入SFG的前饋割集。
缺點:①對非遞歸網(wǎng)絡(luò),增加了鎖存器數(shù)目和系統(tǒng)時延;②流水的多時鐘風格因時鐘歪斜而異化。
改進:一是采用波流水線,減少流水級數(shù),但不增加鎖存器數(shù)目;另一為異步流水,基于握手信號通信而無全局同步。
3。2并行
意義:縮短關(guān)鍵路徑,提速降耗。
本質(zhì):空間并行處理方法,復(fù)制原始串行硬件,構(gòu)造并入并出系統(tǒng)。
特點:其一,并行與流水線互為對偶,二者都挖掘計算的并發(fā)性,一為并行,另一為交替(同步或異步);其二,并行和流水的降耗思路:降低電源電壓,以提高采樣速度換取功耗降低。
4結(jié)論討論
DSP算法起源于17世紀的有限差分、數(shù)值積分和數(shù)值差值等經(jīng)典算法。
DSP算法一般是積和項的疊加繁衍。DSP算法是一種粘合劑,將“數(shù)字匯聚”粘合在一起。
從DSP算法映射到ULSI架構(gòu),是集成電路正向設(shè)計中極其重要的研究課題之一。
針對算法的計算核——積和項,分兵兩路展開研究:一是通過編程,使算法適應(yīng)馮諾伊曼結(jié)構(gòu)或哈佛結(jié)構(gòu)的既有CPU或DSP(數(shù)字信號處理器);另一是改變未知ULSI架構(gòu)來使之適合算法——面向算法的專用處理器陣列設(shè)計,而ULSI(或3D—SOC)的規(guī)則布線要求,需要算法結(jié)構(gòu)化對稱化,以便分解為并行計算。
源于工程實踐的算法具有多樣性的特點,必須改造算法為:有規(guī)律、重復(fù)且并行,如此才能最高速硬件化實現(xiàn)該算法;對于復(fù)雜算法,只好運用組合的非常規(guī)架構(gòu)來映射實現(xiàn)。其中,并行是藏在處理核內(nèi)的加速器!
區(qū)別于通用處理器,當ASIC是可能達到算法性能指標的唯一選擇時,成本因素則降為第二位,必須面向算法研制專用處理器陣列。為降低專用ULSI的成本壁壘,專用處理器基于邏輯元件和寄存器的特定架構(gòu)組合與連接,在犧牲一定可編程靈活性的代價下,特定內(nèi)核的處理速度可大幅度提高(例如:提速1至2個數(shù)量級),避免了因靈活性而付出的硬件開銷;與軟件實現(xiàn)相比,專用硬件實現(xiàn)更小巧,更高速,更低耗。
當專用硬件的性能比現(xiàn)有處理器高10倍以上時,業(yè)界才愿意去設(shè)計ASIC;越來越復(fù)雜的ASIC設(shè)計完成后,也作為固定的硬件平臺使用(最好嵌入適量線控/程控功能),這已成為常用的系統(tǒng)正向設(shè)計方法。
基于EDA工具輔助進行最佳映射時的評價函數(shù),其變量可是:芯片面積(單元總數(shù)和布線數(shù)量)、時間和單元利用率。映射尋優(yōu)的過程,必定是帶著工藝接口思想的DSP—ULSI變換組合優(yōu)化循環(huán)。
當我們完成由DSP驅(qū)動的ULSI架構(gòu)正向設(shè)計旅程,驅(qū)動力的接力棒,尚需交還應(yīng)用市場的問題牽引。
【基于DSP算法的正向設(shè)計方法學(xué)概論論文】相關(guān)文章:
1.基于PowerPC+DSP總線通信軟件的設(shè)計與實現(xiàn)論文
3.基于自適應(yīng)遺傳算法的物流運輸方式選擇研究論文
4.基于Floyd算法的樞紐航線網(wǎng)絡(luò)魯棒優(yōu)化方法的論文