Achievements
語音識別在嵌入式芯片上實現(xiàn)的主要矛盾是算法實現(xiàn)的性能精度與芯片功耗,、速度之間的矛盾,一個性能較好的800條典型漢語普通話語音識別算法以純粹軟件嵌入方案實現(xiàn)通常需要200MIPS以上ARM(Advanced Risc Machine) MCU處理速度,,因此我們提出語音識別集成電路IP與協(xié)處理器來克服以上的問題,,通過關(guān)鍵運算的硬件化映射來大幅提高語音識別計算的功耗和處理速度。該設(shè)計可作為語音識別集成電路IP放入客戶的SoC芯片中,,也可作為協(xié)處理器放在片外,。
關(guān)鍵性能指標如下:
l 工藝:蘇州HJTC 0.18um 1P6M標準CMOS工藝
l 管芯面積:1.5mm x 2mm
l 邏輯規(guī)模:3萬等效門(標準二輸入與非門,不含SRAM)
l I/O數(shù):52 封裝: CQFP64
l 存儲規(guī)模:片上集成1片單口SRAM,,共4K×16比特
l 供電電壓:核心部分->1.8V,,IO部分->3.3V
l 正常工作頻率:20MHz(最高工作頻率100MHz)
l 功耗:80uW/MHz
l 速度:4us/幀(特征維數(shù)取27,時鐘頻率取20MHz)
芯片 |
功耗 |
1倍實時主頻 |
價格 |
Samsung S3C2440 |
0.92mW/MHz |
200MHz |
$20 |
TI TMS320VC5502 |
0.96mW/MHz |
120MHz |
$30 |
Infineon UniSpeech |
1.3mW/MHz |
110MHz |
$15 |
MSAC Coprocessor |
0.08mW/MHz |
20MHz |
面積(3mm2) |
語音識別IP或協(xié)處理器基于對高斯混合模型計算的優(yōu)化,,適合于各種HMM模型的模式識別計算,,在語音識別、說話人識別,、說話人確認,、語音合成等方面均可以廣泛應(yīng)用。
語音識別IP或協(xié)處理器以加速ASIC的模式工作,,相同時鐘主頻下計算性能是TI C54x系列16bit DSP的5.5倍以上,,對主系統(tǒng)計算性能提升可以達到4~8倍。
語音識別IP或協(xié)處理器對于性能要求型場合和功耗限制型場合都十分適合,,芯片支持16bit并行總線接口,,適合于各種32位/16位MCU系統(tǒng),迅速為系統(tǒng)集成高性能語音處理能力,。
(1)車載導(dǎo)航,,GPS手機,支持大規(guī)模識別詞表(例如萬條以上的地名)支持模糊語音檢索,;
(2)中低端手機平臺,,支持語音撥號、語音控制,,支持用戶身份確認,、聲紋密碼。
語音識別IP或協(xié)處理器芯片可應(yīng)用拓展到個人移動信息終端的全市場空間,,以GPS產(chǎn)品為例,,細分的預(yù)裝GPS,、個人導(dǎo)航設(shè)備(Portable Navigation Device,PND),,GPS手機三種產(chǎn)品,,根據(jù)CCID(Consulting China Research Center)咨詢公司預(yù)測2008年這三者分別約占到全球市場總量的15%、35%和50%,??焖僭鲩L的GPS市場,對語音識別功能有著非常迫切而又實際的需求,,GPS應(yīng)用提出的超大規(guī)模詞表,、高混淆度和高環(huán)境復(fù)雜度這一系列語音識別的技術(shù)難題,也只能由語音識別芯片解決,。語音識別加快了人機交互與地名等信息的檢索,,可提高駕駛期間操作GPS的行車安全性,同時可以反過來進一步促進GPS產(chǎn)品的銷售增長,。
語音識別技術(shù)通過芯片在性能得到大幅提升后,,將擺脫傳統(tǒng)的人名撥號功能,可用于菜單控制,、地名,、信息、多媒體內(nèi)容的檢索等等,。而語音識別芯片使得低功耗和低成本的要求得以滿足,,有望成為手機人機交互界面(Man-Machine Interface,MMI)發(fā)展的新技術(shù)增長點,,移動通信領(lǐng)域的市場潛力特別巨大,。
投、融資或技術(shù)許可,。