我國重疾險發(fā)展迎來較大挑戰(zhàn),多因素致銷售增長遇瓶頸
2022-02-18 14:07:03
圖1 FIR加速器的結(jié)構(gòu)
此外,處理器還具有一系列硬件加速器,可以用以實(shí)現(xiàn)通用信號處理運(yùn)算:FIR、IIR濾波器和FFT。而這些運(yùn)算是通信系統(tǒng)、醫(yī)療設(shè)備、消費(fèi)產(chǎn)品和工業(yè)測量與控制應(yīng)用中的基本運(yùn)算。這些加速器是SHARC ADSP-2136x系列處理器片內(nèi)采樣率轉(zhuǎn)換器的有益補(bǔ)充,而采樣率轉(zhuǎn)換器也可以看作硬件加速器。SHARC ADSP-2146x處理器的三個加速器設(shè)計相同,圖1所示的FIR加速器能很好的說明硬件加速器的結(jié)構(gòu)。FIR加速器有以下功能模塊?!?系列控制寄存器——配置加速器的操作?!?DMA控制器——在主存儲器與加速器的本地存儲器之間傳輸數(shù)據(jù),也可以用于配置控制寄存器?!?兩個本地存儲器塊——保存系數(shù)和狀態(tài)變量(或者延遲存儲器),并降低主存儲器的帶寬?!?計算單元——包括適合加速器的算術(shù)操作,F(xiàn)IR的計算單元有4個并行的MAC。使用鏈?zhǔn)紻MA,加速器的操作可以自動完成,F(xiàn)IR加速器的典型操作有以下幾步。(1)將本通道的系數(shù)數(shù)據(jù)由內(nèi)部存儲器載入本地加速器系數(shù)存儲區(qū)。(2)將本通道的狀態(tài)變量從內(nèi)部存儲器載入本地加速器系數(shù)存儲區(qū),這包括第一個輸入樣本。(3)利用四個MAC單元計算輸出樣本。(4)保存結(jié)果。(5)如果還有需要處理的樣本,則讀取下一個輸入樣本,并寫入狀態(tài)變量存儲器。(6)重復(fù)步驟(3)~(5),直到通道中的所有輸出樣本計算完。(7)重復(fù)步驟(1)~(6),計算所有輸入通道。3 加速器的實(shí)際應(yīng)用設(shè)計的應(yīng)用軟件必須盡可能從硬件加速器獲取最多的好處,應(yīng)牢記加速器必須配置成與主CPU并行操作,如果主CPU處于空閑狀態(tài)等待加速器操作完成,這不會帶來任何好處。加速器是實(shí)時環(huán)境中運(yùn)行的大信號鏈的典型部分,與加速器接口需要雙緩存的輸入和輸出數(shù)據(jù),且系統(tǒng)設(shè)計人員也應(yīng)該牢記加速器會帶來一部分延時。設(shè)想一個帶有7.1通道的家庭影院系統(tǒng),采樣率96kHz,數(shù)據(jù)塊大小為32個采樣點(diǎn),假定室內(nèi)均衡應(yīng)用8個FIR濾波器,每個濾波器長度為512點(diǎn),如果采用核CPU執(zhí)行濾波操作,則至少需要每秒96kHz ×8×512=393MMAC個操作,或者占工作在450MHz的SHARC處理器運(yùn)算量的44%。該FIR處理占了整個計算量的很大一部分,但在將來,這些都可以轉(zhuǎn)由加速器來處理。FIR濾波器的輸入和輸出都采用雙緩沖,這樣就可以讓加速器與音頻信號處理鏈的最后環(huán)節(jié)并行處理。當(dāng)然,雙緩沖器會引入32個采樣點(diǎn)的處理延遲,對于96kHz時延遲為333ms,是可以接受的。而利用前面的計算公式,加速器需要50 056個外設(shè)時鐘周期才能完成操作,如果外設(shè)時鐘是225MHz,則需要223ms,這小于333ms的可用塊處理時間。4 結(jié)論音頻處理技術(shù)的進(jìn)一步發(fā)展對音頻DSP提出了更高的要求,集成的硬件加速器為處理器整體處理性能的提升提供了重要的推動力,且將通用的信號處理操作——FIR濾波、IIR濾波和FFT操作——從內(nèi)核處理器中釋放出來,使內(nèi)核可以專注于其他任務(wù),這種高性價比的方法能提高處理器兩倍以上的計算吞吐量。雖然本文主要討論音頻應(yīng)用,但是處理器核和加速器也是通用的,也非常適合于各種信號處理任務(wù)。關(guān)鍵詞: 處理器硬件加速
關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息
Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.ossf.org.cn All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號-12