TMS320 應用參考 (浮點定點)

一 DSP定點算數運算
1 數的定標
在定點DSP芯片中,採用定點數進行數值運算,其操做數通常採用整型數來表示。一個整型數的最大表示範圍取決於DSP芯片所給定的字長,通常爲16位或24位。顯然,字長越長,所能表示的數的範圍越大,精度也越高。如無特別說明,本書均以16位字長爲例。
DSP芯片的數以2的補碼形式表示。每一個16位數用一個符號位來表示數的正負,0表示數值爲正,l則表示數值爲負。其他15位表示數值的大小。所以,
二進制數0010000000000011b=8195
二進制數1111111111111100b= -4
對DSP芯片而言,參與數值運算的數就是16位的整型數。但在許多狀況下,數學運算過程當中的數不必定都是整數。那麼,DSP芯片是如何處理小數的呢?應該說,DSP芯片自己無能爲力。那麼是否是說DSP芯片就不能處理各類小數呢?固然不是。這其中的關鍵就是由程序員來肯定一個數的小數點處於16位中的哪一位。這就是數的定標。
經過設定小數點在16位數中的不一樣位置,就能夠表示不一樣大小和不一樣精度的小數了。數的定標有Q表示法和S表示法兩種。表1.1列出了一個16位數的16種Q表示、S表示及它們所能表示的十進制數值範圍。
從表1.1能夠看出,一樣一個16位數,若小數點設定的位置不一樣,它所表示的數也就不一樣。例如,
16進制數2000H=8192,用Q0表示
16進制數2000H=0.25,用Q15表示
但對於DSP芯片來講,處理方法是徹底相同的。
從表1.1還能夠看出,不一樣的Q所表示的數不只範圍不一樣,並且精度也不相同。Q越大,數值範圍越小,但精度越高;相反,Q越小,數值範圍越大,但精度就越低。例如,Q0 的數值範圍是一32768到 32767,其精度爲1,而Q15的數值範圍爲-1到0.9999695,精度爲1/32768=0.00003051。所以,對定點數而言,數值範圍與精度是一對矛盾,一個變量要想可以表示比較大的數值範圍,必須以犧牲精度爲代價;而想精度提升,則數的表示範圍就相應地減少。在實際的定點算法中,爲了達到最佳的性能,必須充分考慮到這一點。
浮點數與定點數的轉換關係可表示爲:
浮點數(x)轉換爲定點數(xq):xq=(int)x* 2Q
定點數(xq)轉換爲浮點數(x):x=(float)xq*2-Q
例如,浮點數x=0.5,定標Q=15,則定點數xq=L0.5*32768J=16384,式中LJ表示下取整。反之,一個用Q=15表示的定點數16384,其浮點數爲163幼*2-15=16384/32768=0.5。浮點數轉換爲定點數時,爲了下降截尾偏差,在取整前能夠先加上0.5。


表1.1 Q表示、S表示及數值範圍
Q表示 S表示 十進制數表示範圍
Q15 S0.15 -1≤x≤0.9999695
Q14 S1.14 -2≤x≤1.9999390
Q13 S2.13 -4≤x≤3.9998779
Q12 S3.12 -8≤x≤7.9997559
Q11 S4.11 -16≤x≤15.9995117
Q10 S5.10 -32≤x≤31.9990234
Q9 S6.9 -64≤x≤63.9980469
Q8 S7.8 -128≤x≤127.9960938
Q7 S8.7 -256≤x≤255.9921875
Q6 S9.6 -512≤x≤511.9804375
Q5 S10.5 -1024≤x≤1023.96875
Q4 S11.4 -2048≤x≤2047.9375
Q3 S12.3 -4096≤x≤4095.875
Q2 S13.2 -8192≤x≤8191.75
Q1 S14.1 -16384≤x≤16383.5
Q0 S15.0 -32768≤x≤32767
2 高級語言:從浮點到定點
咱們在編寫DSP模擬算法時,爲了方便,通常都是採用高級語言(如C語言)來編寫模擬程序。程序中所用的變量通常既有整型數,又有浮點數。如例1.1程序中的變量i是整型數,而pi是浮點數,hamwindow則是浮點數組。
例1.1 256點漢明窗計算
int i;
float pi=3.14l59;
float hamwindow[256];
for(i=0;i<256;i ) hamwindow[i]=0.54-0.46*cos(2.0*pi*i/255);
若是咱們要將上述程序用某種足點DSP芯片來實現,則需將上述程序改寫爲DSP芯片的彙編語言程序。爲了DSP程序調試的方便及模擬定點DSP實現時的算法性能,在編寫DSP彙編程序以前通常需將高級語言浮點算法改寫爲高級語言定點算法。下面咱們討論基本算術運算的定點實現方法。
2.1 加法/減法運算的C語言定點摸擬
設浮點加法運算的表達式爲:
float x,y,z;
z=x y;
將浮點加法/減法轉化爲定點加法/減法時最重要的一點就是必須保證兩個操做數的定標
temp=x temp;
z=temp>>(Qx-Qz),若Qx>=Qz
z=temp<<(Qz-Qx),若Qx<=Qz
例1.4結果超過16位的定點加法
設x=l5000,y=20000,則浮點運算值爲z=x y=35000,顯然z>32767,所以
Qx=1,Qy=0,Qz=0,則定點加法爲:
x=30000;y=20000;
temp=20000<<1=40000;
temp=temp x=40000 30000=70000;
z=70000L>>1=35000;
由於z的Q值爲0,因此定點值z=35000就是浮點值,這裏z是一個長整型數。當加法或加法的結果超過16位表示範圍時,若是程序員事先可以瞭解到這種狀況,而且須要保持運算精度時,則必須保持32位結果。若是程序中是按照16位數進行運算的,則超過16位實際上就是出現了溢出。若是不採起適當的措施,則數據溢出會致使運算精度的嚴重惡化。通常的定點DSP芯片都沒有溢出保護功能,當溢出保護功能有效時,一旦出現溢出,則累加器ACC的結果爲最大的飽和值(上溢爲7FFFH,下溢爲8001H),從而達到防止溢出引發精度嚴重惡化的目的。
2.2乘法運算的C語言定點模擬
設浮點乘法運算的表達式爲:
float x,y,z;
z=xy;
假設通過統計後x的定標值爲Qx,y的定標值爲Qy,乘積z的定標值爲Qz,則
z=xy
zq*2-Qx=xq*yq*2-(Qx Qy)
zq=(xqyq)2Qz-(Qx Qy)
因此定點表示的乘法爲:
int x,y,z;
long temp;
temp=(long)x;
z=(temp*y)>>(Qx Qy-Qz);
例1.5定點乘法。
設x=18.4,y=36.8,則浮點運算值爲=18.4*36.8=677.12;
根據上節,得Qx=10,Qy=9,Qz=5,因此
x=18841;y=18841;
temp=18841L;
z=(18841L*18841)>>(10 9-5)=354983281L>>14=21666;
由於z的定標值爲5,故定點z=21666,即爲浮點的z=21666/32=677.08。
2.3除法運算的C語言定點摸擬
設浮點除法運算的表達式爲:
float x,y,z;
z=x/y;
假設通過統計後被除數x的定標值爲Qx,除數y的定標值爲Qy,商z的定標值爲Qz,則
z=x/y
zq*2-Qz=(xq*2-Qx)/(yq*2-Qy)
zq=(xq*2(Qz-Qx Qy))/yq
因此定點表示的除法爲:
int x,y,z;
long temp;
temp=(long)x;
z=(temp<<(Qz-Qx Qy))/y;
例1.6定點除法。
設x=18.4,y=36.8,浮點運算值爲z=x/y=18.4/36.8=0.5;
根據上節,得Qx=10,Qy=9,Qz=15;因此有
z=18841,y=18841;
temp=(long)18841;
z=(18841L<<(15-10 9)/18841=3O8690944L/18841=16384;
由於商z的定標值爲15,因此定點z=16384,即爲浮點z=16384/215=0.5。
2.4程序變量的Q值肯定
在前面幾節介紹的例子中,因爲x,y,z的值都是已知的,所以從浮點變爲定點時Q值很好肯定。在實際的DSP應用中,程序中參與運算的都是變量,那麼如何肯定浮點程序中變量的Q值呢?從前面的分析能夠知道,肯定變量的Q值實際上就是肯定變量的動態範圍,動態範圍肯定了,則Q值也就肯定了。
設變量的絕對值的最大值爲|max|,注意|max|必須小於或等於32767。取一個整數n,使知足
2n-1<|max|<2n
則有
2-Q=2-15*2n=2-(15-n)
Q=15-n
例如,某變量的值在-1至 1之間,即|max|<1,所以n=0,Q=15-n=15。
既然肯定了變量的|max|就能夠肯定其Q值,那麼變量的|max|又是如何肯定的呢?通常來講,肯定變量的|max|有兩種方法。一種是理論分析法,另外一種是統計分析法。
1. 理論分析法
有些變量的動態範圍經過理論分析是能夠肯定的。例如:
(1)三角函數。y=sin(x)或y=cos(x),由三角函數知識可知,|y|<=1。
(2)漢明窗。y(n)=0.54一0.46cos[nπn/(N-1)],0<=n<=N-1。由於-1<=cos[2πn/(N-1)]<=1,因此0.08<=y(n)<=1.0。
(3)FIR卷積。y(n)=∑h(k)x(n-k),設∑|h(k)|=1.0,且x(n)是模擬信號12位量化值,即有|x(n)|<=211,則|y(n)|<=211。
(4)理論已經證實,在自相關線性預測編碼(LPC)的程序設計中,反射係數ki知足下列不等式:|ki|<1.0,i=1,2,...,p,p爲LPC的階數。
2. 統計分析法
對於理論上沒法肯定範圍的變量,通常採用統計分析的方法來肯定其動態範圍。所謂統計分析,就是用足夠多的輸入信號樣值來肯定程序中變量的動態範圍,這裏輸入信號一方面要有必定的數量,另外一方面必須儘量地涉及各類狀況。例如,在語音信號分析中,統計分析時就必須來集足夠多的語音信號樣值,而且在所採集的語音樣值中,應儘量地包含各類狀況。如音量的大小,聲音的種類(男聲、女聲等)。只有這樣,統計出來的結果才能具備典型性。
固然,統計分析畢竟不可能涉及全部可能發生的狀況,所以,對統計得出的結果在程序設計時可採起一些保護措施,如適當犧牲一些精度,Q值取比統計值稍大些,使用DSP芯片提供的溢出保護功能等。
2.5浮點至定點變換的C程序舉例
本節咱們經過一個例子來講明C程序從浮點變換至定點的方法。這是一個對語音信號(0.3~3.4kHz)進行低通濾波的C語言程序,低通濾波的截止頻率爲800Hz,濾波器採用19點的有限衝擊響應FIR濾波。語音信號的採樣頻率爲8kHz,每一個語音樣值按16位整型數存放在insp.dat文件中。
例1.7語音信號800Hz 19點FIR低通濾波C語言浮點程序。
#include <stdio.h>
const int length=180/*語音幀長爲180點=22.5ms@8kHz採樣*/
void filter(int xin[],int xout[],int n,float h[]);/*濾波子程序說明*/
/*19點濾波器係數*/
static float h[19]=
{0.01218354,-0.009012882,-0.02881839,-0.04743239,-0.04584568,
-0.008692503,0.06446265,0.1544655,0.2289794,0.257883,
0.2289794,0.1544655,0.06446265,-0.008692503,-0.04584568,
-0.04743239,-0.02881839,-0.009012882,O.01218354};
static int xl[length 20];
/*低通濾波浮點子程序*/
void filter(int xin[],int xout[],int n,float h[])
{
int i,j;
float sum;
for(i=0;i<length;i )x1[n i-1]=xin[i];
for(i=0;i<length;i )
{
sum=0.0;
for(j=0;j<n;j )sum =h[j]*x1[i-j n-1];
xout[i]=(int)sum;
for(i=0;i<(n-l);i )x1[n-i-2]=xin[length-1-i];
}
/*主程序*/
void main()
FILE *fp1,*fp2;
int frame,indata[length],outdata[length];
fp1=fopen(insp.dat,"rb");/* 輸入語音文件*/
fp2=fopen(Outsp.dat,"wb");/* 濾波後語音文件*/
frame=0;
while(feof(fp1) ==0)
{
frame ;
printf(「frame=%d\n」,frame);
for(i=0;i<length;i )indata[i]=getw(fp1); /*取一幀語音數據*/
filter(indata,outdata,19,h);/*調用低通濾波子程序*/
for(i=0;i<length;i )putw(outdata[i],fp2);/*將濾波後的樣值寫入文件*/
}
fcloseall();/*關閉文件*/
return(0);
}
例1.8語音信號800Hz l9點FIR低通濾波C語言定點程序。
#include <stdio.h>
const int length=180;
void filter (int xin[],int xout[],int n,int h[]);
static int h[19]={399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450,
7503,5061,2112,-285,-1503,-1555,-945,-296,399};/*Q15*/
static int x1[length 20];
/*低通濾波定點子程序*/
void filter(int xin[],int xout[],int n,int h[])
int i,j;
long sum;
for(i=0;i<length;i )x1[n+i-111=xin][i];
for(i=0;i<1ength;i )
sum=0;
for(j=0;j<n;j )sum =(long)h[j]*x1[i-j+n-1];
xout[i]=sum>>15;
for(i=0;i<(n-1);i++)x1[n-i-2]=xin[length-i-1];
}
主程序與浮點的徹底同樣。「
3 DSP定點算術運算
定點DSP芯片的數值表示基於2的補碼錶示形式。每一個16位數用l個符號位、i個整數位和15-i個小數位來表示。所以:
00000010.10100000
表示的值爲:
21+2-1+2-3=2.625
這個數可用Q8格式(8個小數位)來表示,其表示的數值範圍爲-128至+l27.996,一個Q8定點數的小數精度爲1/256=0.004。
雖然特殊狀況(如動態範圍和精度要求)必須使用混合表示法。可是,更一般的是所有以Q15格式表示的小數或以Q0格式表示的整數來工做。這一點對於主要是乘法和累加的信號處理算法特別現實,小數乘以小數得小數,整數乘以整數得整數。固然,乘積累加時可能會出現溢出現象,在這種狀況下,程序員應當瞭解數學裏面的物理過程以注意可能的溢出狀況。下面咱們來討論乘法、加法和除法的DSP定點運算,彙編程序以TMS320C25爲例。
3.1定點乘法
兩個定點數相乘時能夠分爲下列三種狀況:
1. 小數乘小數
例1.9 Q15*Q15=Q30
0.5*0.5=0.25
0.100000000000000;Q15
* 0.100000000000000;Q15
--------------------------------------------
00.010000000000000000000000 000000=0.25;Q30
兩個Q15的小數相乘後獲得一個Q30的小數,即有兩個符號位。通常狀況下相乘後獲得的滿精度數沒必要所有保留,而只需保留16位單精度數。因爲相乘後獲得的高16位不滿15位的小數據度,爲了達到15位精度,可將乘積左移一位,下面是上述乘法的TMS320C25程序:
LT OP1;OP1=4000H(0.5/Q15)
MPY OP2;oP2=4000H(0.5/Ql5)
PAC
SACH ANS,1;ANS=2000H(0.25/Q15)
2. 整數乘整數
例1.10 Q0*Q0=Q0
17*(-5)=-85
0000000000010001=l7
*1111111111111011=-5
-------------------------------------------
111111111111111111111111 10101011=-85
3. 混合表示法
許多狀況下,運算過程當中爲了既知足數值的動態範圍又保證必定的精度,就必須採用Q0與Q15之間的表示法。好比,數值1.2345,顯然Q15沒法表示,而若用Q0表示,則最接近的數是1,精度沒法保證。所以,數1.2345最佳的表示法是Q14。
例1.11 1.5*0.75= 1.125
01.10000000000000=1.5;Q14
*00.11000000000000=0.75;Q14
---------------------------------------
0001.001000000000000000000000 0000=1.125 Q28
Q14的最大值不大於2,所以,兩個Q14數相乘獲得的乘積不大於4。
通常地,若一個數的整數位爲i位,小數位爲j位,另外一個數的整數位爲m位,小數位爲n位,則這兩個數的乘積爲(i m)位整數位和(j n)位小數位。這個乘積的最高16位可能的精度爲(i+m)整數位和(15- i- m)小數位。
可是,若事先了解數的動態範圍,就能夠增長數的精度。例如,程序員瞭解到上述乘積不會大於1.8,就能夠用Q14數表示乘積,而不是理論上的最佳狀況Q13。例3.11的TMS320C25程序以下:
LT OP1;OP1 = 6000H(1.5/Ql4)
MPY OP2;OP2 = 3000H(0.75/Q14)
PAC
SACH ANS,1;ANS=2400H(1.125/Q13)
上述方法,爲了精度均對乘的結果舍位,結果所產生的偏差至關於減去一個LSB(最低位)。採用下面簡單的舍人方法,可以使偏差減小二分之一。
LT OP1
MPY OP2
PAC
ADD ON E,14(上舍入)
SACH ANS,1
上述程序說明,無論ANS爲正或負,所產生的偏差是l/2 LSB,其中存儲單元ON E的值爲1。
3.2定點加法
乘的過程當中,程序員可不考慮溢出而只需調整運算中的小數點。而加法則是一個更加複雜的過程。首先,加法運算必須用相同的Q點表示,其次,程序員或者容許其結果有足夠的高位以適應位的增加,或者必須準備解決溢出問題。若是操做數僅爲16位長,其結果可用雙精度數表示。下面舉例說明16位數相加的兩種途徑。
1.保留32位結果
LAC OP1;(Q15)
ADD OP2;(Ql5)
SACH ANSHI ;(高16位結果)
SACL ANSLO :(低16位結果)
2.調整小數點保留16位結果
LAC OP1,15;(Q14數用ACCH表示)
ADD OP2,15;(Q14數用ACCH表示)
SACH ANS;(Q14)
加法運算最可能出現的問題是運算結果溢出。TMS320提供了檢查溢出的專用指令BV,此外,使用溢出保護功能可以使累加結果溢出時累加器飽和爲最大的整數或負數。固然,即便如此,運算精度仍是大大下降。所以,最好的方法是徹底理解基本的物理過程並注意選擇數的表達方式。
3.3定點除法
在通用DSP芯片中,通常不提供單週期的除法指令,爲此必須採用除法子程序來實現。二進制除法是乘法的逆運算。乘法包括一系列的移位和加法,而除法可分解爲一系列的減法和移位。下面咱們來講明除法的實現過程。
設累加器爲8位,且除法運算爲10除以3。除的過程包括與被除法有關的除數逐步移位,在每一步進行減法運算,若是能減則將位插入商中。
(1)除數的最低有效位對齊被除數的最高有效位。
0000l0l0
- 00011000
--------------------------------------
11110010
(2)因爲減法結果爲負,放棄減法結果,將被除數左移一位,再減。
00010100
- 00011000
----------------------------------------
11111000
(3)結果仍爲負,放棄減法結果,被除數左移一位,再減。
00101000
- 00011000
------------------------------------------
00010000
(4)結果爲正,將減法結果左移一位後加1,做最後一次減。
00100001
- 00011000
----------------------------------------
00001001
(5)結果爲正,將結果左移一位加1 得最後結果。高4位表明餘數,低4位表示商。
00010011
即,商爲0011= 3.餘數爲0001= 1。
TMS320沒有專門的除法指令,但使用條件減指令SUBC能夠完成有效靈活的除法功能。使用這一指令的惟一限制是兩個操做數必須爲正。程序員必須事先了解其可能的運算數的特性,如其商是否能夠用小數表示及商的精度是否可被計算出來。這裏每一種考慮可影響如何使用SUBC指令的問題。下面咱們給出兩種不一樣狀況下的TMS320C25除法程序。
(1)分子小於分母
DIV_A:
LT NUMERA
MPY DENOM
PAC
SACH TEMSGN;取商的符號
LAC DENOM
ABS
SACL DENOM;使分母爲正
ZALH NUMERA; 分子爲正
ABS
RPTK 14
SUBC DENOM;除循環15次
SACL QUOT
LAC TEMSGN
BGEZ A1;若符號爲正,則完成
ZAC
SUB QUOT
SACL QUOT;若爲負,則商爲負
A1: RET
這個程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN爲暫存單元。
(2)規定商的精度
DIV_B:
LT NUMERA
MPY DENOM
PAC
SACH TEMSGN;取商的符號
LAC DENOM
ABS
SACL DENOM; 使分母爲正
LACK 15
ADD FRAC
SACL FRAC;計算循環計數器
LAC NUMERA
ABS ; 使分子爲正
RPT FRAC
SUBC DENOM; 除循環16+FRAC次
SACL QUOT
LAC TEMSGN
BGEZ B1;若符號爲正,則完成
ZAC
SUB QUOT
SACL QUOT;若爲負,則商爲負
B1: RET
與DIV_A相同,這個程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN爲暫存單元。FRAC中規定商的精度,如商的精度爲Q13,則調用程序前FRAC單元中的值應爲13。
4 非線性運算的定點快速實現
在數值運算中,除基本的加減乘除運算外,還有其它許多非線性運算,如,對數運算,開方運算,指數運算,三角函數運算等,實現這些非線性運算的方法通常有:(1)調用DSP編譯系統的庫函數;(2)查表法;(3)混合法。下面咱們分別介紹這三種方法。
1.調用DSP編譯系統的庫函數
TMS320C2X/C5X的C編譯器提供了比較豐富的運行支持庫函數。在這些庫函數中,包含了諸如對數、開方、三角函數、指數等經常使用的非線性函數。在C程序中(也可在彙編程序中)只要採用與庫函數相同的變量定義,就能夠直接調用。例如,在庫函數中,定義了以10爲底的經常使用對數log10():
#include<math.h>
double,log10(double x);
在C程序中按以下方式調用:
float x,y;
X=10.0;
y=log10(x);
從上例能夠看出,庫函數中的經常使用對數log10()要求的輸入值爲浮點數,返回值也爲浮點數,運算的精度徹底能夠保證。直接調用庫函數很是方便,但因爲運算量大,很難在實時DSP中獲得應用。
2.查表法
在實時DSP應用中實現非線性運算,通常都採起適當下降運算精度來提升程序的運算速度。查表法是快速實現非線性運算最經常使用的方法。採用這種方法必須根據自變量的範圍和精度要求製做一張表格。顯然輸人的範圍越大,精度要求越高,則所需的表格就越大,即存儲量也越大。查表法求值所需的計算就是根據輸入值肯定表的地址,根據地址就可獲得相應的值,於是運算量較小。查表法比較適合於非線性函數是周期函數或已知非線性函數輸入值範圍這兩種狀況、例1.12和例1. 13分別說明這兩種狀況。
例1.12 已知正弦函數y=cos(x),製做一個512點表格,並說明查表方法。因爲正弦函數是周期函數,函數值在-1至 1之間,用查表法比較合適。因爲Q15的表示範圍爲1-至32767/32768之間,原則上講-1至+1的範圍必須用Q14表示。但通常從方便和整體精度考慮,相似狀況仍用Q15表示,此時 1用32767來表示。
(1)產生5l2點值的C語言程序以下所示。
#define N 512
#define pi 3.14l59
int sin_tab[5l2];
void main()
{
int i;
for(i=0;i<N;i )sin_tab[i]=(int)(32767*sin(2*pi*i/N));
(2)查表
查表實際上就是根據輸人值肯定表的地址。設輸入x在0~2π之間,則x對應於512點表的地址爲:index=(int)(512*x/2π),則y=sin(x)=sin_tab[index]若是x用Q12定點數表示,將512/2π用Q8表示爲20861,則計算正弦表的地址的公式爲。
index=(x*20861L)>>20;
例1.12用查表法求以2爲底的對數,已知自變量值範圍爲0.5-1,要求將自變量範圍均勻劃分爲10等分。試製做這個表格並說明查表方法。
(1)做表:
y=log2(x),因爲x在0.5到1之間,所以y在-1到0之間,x和y都可用Q15表示。因爲對x均勻劃分爲10段,所以,10段對應於輸入x的範圍如表3.2所示。若每一段的對數值都取第一點的對數值,則表中第一段的對數值爲y0(Q15)=(int)(log(O.5)*32768),第二段的對數值爲y1(Q15)=(int)(log2(0.55)*32768),依次類推,如表3.2所示。
(2)查表:
查表時,先根據輸人值計算表的地址,計算方法爲:
index=((x-16384)*20)>>15;
式中, index就是查表用的地址。例如,已知輸人x=26869,則index=6,所以,y= -10549。
表1.2 logtab0 10點對數表
地址 輸入值 對數值(Q15)
0 0.50-0.55 -32768
1 0.55-0.60 -28262
2 0.60-0.65 -24149
3 0.65-0.70 -20365
4 0.70-0.75 -16862
5 0.75-0.80 -13600
6 0.80-0.85 -10549
7 0.85-0.90 -7683
8 0.90-0.95 -4981
9 0.95-1.00 -2425
3.混合法
(1)提升查表法的精度
上述方法查表所得結果的精度隨表的大小而變化,表越大,則精度越高,但存儲量也越大。當系統的存儲量有限而精度要求也較高時,查表法就不太適合。那麼可否在適當增長運算量的狀況下提升非線性運算的精度呢?下面介紹一種查表結合少許運算來計算非線性函數的混合法,這種方法適用於在輸入變量的範圍內函數呈單調變化的情形。混合法是在查表的基礎上來用計算的方法以提升當輸入值處於表格兩點之間時的精度。提升精度的一個簡便方法是採用折線近似法,如圖1.1所示。
圖1.1提升精度的折線近似法」
仍以求以2爲底的對數爲例(例1.12)。設輸入值爲x,則精確的對數值爲y,在表格值的兩點之間做一直線,用y'做爲y的近似值,則有:
y'=y0+△y
其中y0由查表求得。如今只需在查表求得y0的基礎上增長△y既可。△y的計算方法以下: △y=(△x/△x0)△y=△x(△y0/△x0)
其中△y0/△x0對每一段來講是一個恆定值,可做一個表格直接查得。此外計算此時需用到每段橫座標的起始值,這個值也可做一個表格。這佯共有三個大小均爲10的表格,分別爲存儲每段起點對數值的表logtab0、存儲每段△y0/△x0值的表logtab1和存儲每段輸入起始值x0的表logtab2,表logtab1和表logtab2可用下列兩個數組表示。
int logtab1[10]={22529,20567,18920,17517,16308,
15255,14330,13511,12780,12124};/*△y0/△x0:Q13*/
int logtab2[10]={16384,18022,19660,21299,22938,
24576,26214,27853,29491,31130};/*x0:Q15*/
綜上所述,採用混合法計算對數值的方法可概括爲:
(1)根據輸人值,計算查表地址:index=((x-16384)*20)>>15;
(2)查表得y0=logtab0[index];
(3)計算△x=x-logtab2[index];
(4)計算△y=(△x*logtab1[index])>>13;
(5)計算得結果y=y0+△y。
例1.13已知x=0.54,求log2(x)。
0.54的精確對數值爲y=log2(0.54)=-0.889。
混合法求對數值的過程爲:
(1)定標Q15,定標值x=0.54*32768=17694;
(2)表地址index=((x-16384)*20)>>15=0;
(3)查表得y0=logtab0[0]=-32768;
(4)計算△x=x-logtab2[0]=17694-16384=1310;
(5)計算△y=(△xlogtab1[0]>>13=(13l0*22529L)>>13=3602
(6)計算結果y=y0+△y=-32768+3602=-29166。
結果y爲Q15定標,析算成浮點數爲-29166/32768=-0.89,可見精度較高。
(2)擴大自變量範圍
如上所述,查表法比較適用於周期函數或自變量的動態範圍不是太大的情形。對於像對數這樣的非線性函數,輸入值和函數值的變化範圍都很大。若是輸入值的變化範圍很大,則做表就比較困難。那麼可否比較好地解決這個問題,即不便表格太大,又能獲得比較高的精度呢?下面咱們來討論一種切實可行的方法。
設x是一個大於0.5的數,則x能夠表示爲下列形式:
x=m*2e
式中,0.5<=m<=1.0,e爲整數。則求x的對數能夠表示爲:
log2(x)=log2(m*2e)=log2(m)+log2(2e)=e+log2(m)
也就是說,求x的對數實際上只要求m的對數就能夠了,而因爲m的數值在0.5和1.0之間,用上面介紹的方法是徹底能夠實現的。例如:
log2(10000)=log2(0.61035*214)=log2(0.61035) 14 =13.2877
可見,若是一個數能夠用比較簡便的方法表示爲上面的形式,則求任意大小數的對數也比較方便的。TMS320C2X/C5X指令集提供了一條用於對ACC中的數進行規格化的指令NORM,該指令的做用就是使累加器中的數左移,直至數的最高位被移至累加器的第30位。例如,對數值10000進行規格化的TMS320C25程序爲。
LAC #10000
SACL TEMP
ZALH TEMP
LAR AR1,#0FH
RPT 14
NORM * -
上述程序執行後,AR1=#0eH,ACCH=2000(10進制)。對一個16位整數x進行上述程序處理實際上就是做這樣一個等效變換:
x=[(x*2e)/32768]*215-Q
其中,寄存器AR1包含的值爲15-Q累加器ACC高16位包含的值爲x.2Q,其數值在16384至32768之間。
例1.14實現以2爲底的對數的C定點模擬程序。
int logtab0[10]={-32768,-28262,-24149,-20365,-16862,
-13600),-1O549,-7683,-4981,-2425};/*Q15*/
int logtab1[10]={122529,20567,18920,175l7,16308,
15255,14330,13511,12780,12124};/*Q13*/
int logtab2[10]={16384,l8022,19660,21299,22938,
24576,26214,27853,29491,31130};/*Q15*/
int log2_fast(int Am)
{
int point,point1;
int index,x0,dx,dy,y;
point=0;
while(Am<16384){point++;Am=Am<<1;}/*對Am進行規格化*/
point1=(15-point-4)*512;/*輸入爲Q4,輸出爲Q9*/
index=((Am-16384)*20L)>>15;/*求查表地址*/
dx=Am-logtab2[index];
dy=((long)dx*logtab1[index])>>13;
y=(dy+longtab0[index])>>6;/*Q9*/
y=point1+y;
return(y);
}
上述程序中,輸入值Am採用Q4表示,輸出採用Q9表示,若是輸入輸出的Q值與上面程序中的不一樣,則應做相應的修改。
以上討論了DSP芯片進行定點運算所涉及的一些基本問題,這些問題包括:數的定標,DSP程序的定點模擬,DSP芯片的足點運算以及定點實現非線性函數的快速實現方法等。充分理解這些問題對於用定點芯片實現DSP算法具備很是重要的做用。
二 用C語言設計TMS320C2X/C5X應用程序
1、存儲器模式
TMS320C2X/C5X定點處理器有兩種類型的存儲器:程序存儲器和數據存儲器。在程序存儲器中主要包含可執行的程序代碼,在數據存儲器中,則主要包含外部變量、靜態變量和系統堆棧。由C程序生成的每一塊程序或數據存放於存儲空間的一個連續塊中。
(一)C編譯器生成的塊
由TMS320C2X/C5X編譯器編譯生成的塊共有六種,可分爲兩大類。在六種塊中,除了具備浮點C編譯器生成的五種塊以外,還有一個.switch塊,它是一個已初始化塊,包含爲 .switoh語句創建的表格。
(二)C系統堆棧
定點C系統堆棧的做用與浮點c編譯器的C系統堆棧的做用徹底相同,管理堆棧的方法也基本相似。但管理C相同堆棧所用的寄存器是不同的。定點C編譯器採用下面兩個寄存器來管理這個堆棧:
AR1——是堆棧指針(SP)。它指向堆棧的頂部。
AR0——幀指針(FP)。指向當前幀的開始。
激活每一個函數時,都在堆棧中創建一個新的幀,以用於分配局部變量和臨時變量。C環境可以自動管理這些寄存器。若是須要編寫用到運行堆棧的彙編程序,必須正確使用這些寄存器。
與浮點C編譯器同樣,定點C編譯器的堆棧長度也由連接器肯定,全局符號_STACK_SIZE的值等於堆棧長度,單位爲字節,缺省值爲1K字節。一樣,須要改變堆棧長度時,在連接時用-stack選項,並在其後指定一個數值。
(三)動態存儲器分配
在運行支持庫中,有幾個容許在運行時進行動態存儲器分配的函數,如malloc、calloc、realloc,動態存儲器分配的方法與浮點C編譯器的動態存儲器分配徹底相同。
(四)靜態和全局變量的存儲器分配
在C程序中說明的每個外部或靜態變量被分配給一個惟一的連續空間。空間的地址
由連接器肯定。編譯器保證這些變量的空間分配在多個字中以使每一個變量按字邊界對準。
(五)域/結構的對準
編譯器爲結構分配空間時,它分配足夠的字以包含全部的結構成員,在一組結構中,每一個結構開始於字邊界。
全部的非域類型對準於字的邊界。對域分配足夠多的比特,相鄰域組裝進一個字的相鄰比特,但不跨越兩個字。若是一個域要跨越兩個字,則整個域分配到下一個字中。
2、寄存器規則
與浮點C編譯器同樣,在定點c編譯器中也定義了嚴格的寄存器使用規則。這些規則對於編寫彙編語言與C語言的接口很是重要。若是編寫的彙編程序不符合寄存器使用規則,則C環境將被破壞。
C編譯器使用寄存器的方法在使用和不使用優化器時是不同的。由於優化器須要使用額外的寄存器做爲寄存器變量以提升程序的運行效率。但函數調用時保護寄存器的規則在使用和不使用優化器時是同樣的。下面咱們來介紹定點C編譯器使用寄存器的規則。
(一)特定寄存器
定點C環境中保留了三個寄存器:AR0、AR一、AR2, 它們的做用以下:
AR0——幀指針
AR1——堆棧指針
AR2——局部變量指針(用於計算局部變量的地址)
(二)寄存器使用
彙編用於函數中,可使用輔助寄存器、T寄存器和P寄存器、各類狀態寄存器,在使用時必須符合下列規則:
1. 輔助寄存器(ARP和AR0 ~ AR7)
函數進入和返回時,ARP必須爲1,也就是說當前的輔助寄存器爲AR1。函數執行時能夠是其它值。
AR0和AR1能夠在函數執行過程當中修改,但它們必須恢復。
AR二、AR三、AR4和AR5能夠自由使用,也就是說,在函數執行過程當中能夠修改,也沒必要恢復。
AR6和AR7用做寄存器變量。若是在函數中被修改,必須加以保護和恢復。
2. 狀態寄存器
在C編譯器中,始終假定PM狀態位爲0。若是函數改變PM值,則在函數返回時必須將PM從新設置爲0。在TMS320C5X中,TRM位必須保持爲0,硬件復位時TRM爲0。對其它狀態位既能夠修改,也沒必要恢復。如DP、C、FSM、HM、INTM、OV、OVM、SXM、TC、TXM、CNF、FO和XF等。
3. 其它寄存器
累加器ACC能夠自由使用,沒必要保護和恢復。ACC能夠用來返回整數、指針和浮點值、P和T寄存器也能夠自由使用。
(三)寄存器變量
在一個函數中,定點C編譯器能夠自由使用多至兩個寄存器變量。若是要在函數中使用寄存器變量,則應在函數的參數表或函數的第一塊中定義。不然,做爲通常的變量處理。編譯器用AR6和AR7做爲寄存器變量,其中AR6分配給第一個寄存器變量,AR7分配給第二個寄存器變量。因爲在運行時創建一個寄存器變量約需4個指令週期,所以,只有當一個變量訪問2次以上,使用寄存器變量的效果才能明顯地體現出來。
3、函數調用規則
定點C編譯器也規定了一組嚴格的函數調用規則。除了特殊的運行支持函數外,任何調用C函數或被C函數所調用的函數都必須遵循這些規則,不然就會破壞C環境,形成不可預測的後果。
(一)參數傳遞
將參數傳遞給一個C函數時,必須遵循下列規則:
(1)函數調用前,將多數壓入運行堆棧。。
(2)以逆序傳遞參數。也就是說。第一個參數(最左邊)最後壓棧,而最後一個參數(最右邊)最早壓棧。
(3)若參數是浮點數或長整型數,則低位字先壓棧,高位字後壓棧。
(4)傳遞結構時,採用多字方式。
(二)局部幀的產生
函數被調用時,編譯器在運行棧中創建一個幀以存儲信息。當前函數幀稱爲局部幀。C環境利用局部幀來保護調用者的有關信息、傳遞參數和生成局部變量。每調用一個函數,就創建一個新的幀。
上面已經介紹,寄存器AR1爲SP,AR0爲FP,SP指向棧頂,FP指向局部幀。編譯器在創建局部幀時完成以下工做:
(1)從TMS320C2X/C5X的內部堆棧中彈出返回地址,並壓人C運行堆棧。
(2)將舊的FP的內容壓人C運行堆棧,並將FP設置爲當前的SP。
(3)增長SP。增長的值等於須要保存的局部變量的字的個數加1,其中,額外的一個字位於幀的開始,用於存儲臨時變量。
(4)若函數使用AR6和AN7做爲寄存器變量,則將它們的內容壓人堆棧,而後裝人相應局部變量的地址。
下面是完成上述工做的TMS320C2X的彙編程序,其中SIZE是局部幀的長度。
例2.1 調用函數時的初始處理
POPD * ;將返回地址壓人C堆棧
SAR AR0, * ;保護舊FP
SAR AR1, *
LARK AR0, SIZE
LAR ARO, * 0 ;FP= 舊的SP,SP=SP SIZE
SAR AR6,* ;保護AR6
SAR AR7, * ;保護AR7
下面是一些產生局部幀時的注意事項:
(1)函數進入時,編譯器認爲ARP爲1。
(2)沒有獨立的參數表指針。指向參數時,幀指針用負偏移,指向局部變量時,用正偏移;
(3)幀指針AR0指向一個獨立的字,這個字在局部變量前分配,用於存儲臨存值,經過AR0直接訪問。
(4)編譯器用AR2來計算局部變量的地址。通常來講,局部變量的偏移值放在AR2中,而後加上AR0。
(5)對TMS320C5X來講上面的程序稍有不一樣,但做用是同樣的。
相關文章
相關標籤/搜索