設計并實現(xiàn)了一種基于定點數(shù)字信號處理器(DSP)的語音識別與控制系統(tǒng)。由音頻編解碼芯片(TLV320AIC23)負責采集語音信號;以定點DSP(TMS320VC5509A)作為運算處理單元;通過定點運算與浮點運算的有機結合,解決了處理速度與處理精度之間的矛盾;在保證處理速度的前提下,提高了運算精度和識別率。
設計并實現(xiàn)了一種基于定點數(shù)字信號處理器(DSP)的語音識別與控制系統(tǒng)。由音頻編解碼芯片(TLV320AIC23)負責采集語音信號;以定點DSP(TMS320VC5509A)作為運算處理單元;通過定點運算與浮點運算的有機結合,解決了處理速度與處理精度之間的矛盾;在保證處理速度的前提下,提高了運算精度和識別率。
隨著DSP技術的進步,計算能力更強、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機上植入更精確更復雜的自動語音識別(ASR)功能成為可能。目前,基本ASR應用可以分成三大類:1. 語音-文本轉換(語音輸入);2. 講者識別;3. 語音命令控制(語音控制)。 這三類功能包含了3G所需的眾多ASR性能。語音-文本轉換的典型實例是語音撥號和電子郵件聽寫。講者識別功能可以通過語音識別安全地讀出存儲器中的個人數(shù)據(jù),從而滿足信用卡定購和銀行服務等保密性高的應用需要。語音命令控制功能包括連接語音擴展標記語言(VXML)網(wǎng)站內(nèi)容的語音接口,它支持財經(jīng)服務與目錄助理等業(yè)務。目前VXML被用于規(guī)范網(wǎng)站內(nèi)容的語音標簽。
隨著DSP技術的進步,計算能力更強、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機上植入更精確更復雜的自動語音識別(ASR)功能成為可能。目前,基本ASR應用可以分成三大類:1. 語音-文本轉換(語音輸入);2. 講者識別;3. 語音命令控制(語音控制)。 這三類功能包含了3G所需的眾多ASR性能。語音-文本轉換的典型實例是語音撥號和電子郵件聽寫。講者識別功能可以通過語音識別安全地讀出存儲器中的個人數(shù)據(jù),從而滿足信用卡定購和銀行服務等保密性高的應用需要。語音命令控制功能包括連接語音擴展標記語言
現(xiàn)在的語音識別處理器集成了更多功能,它們的精確度也更高,并有更好的開發(fā)工具支持,這使得在消費電子產(chǎn)品中添加語音I/O變得相對容易。
本文從可復用和優(yōu)化芯片空間的角度出發(fā)介紹語音識別芯片結構設計的種種考慮,其思路有利于開發(fā)一系列其它語音識別芯片。
本文從可復用和優(yōu)化芯片空間的角度出發(fā)介紹語音識別芯片結構設計的種種考慮,其思路有利于開發(fā)一系列其它語音識別芯片。
本文給出了在運用RSC-3x設計高性能的語音識別產(chǎn)品時應考慮的與硬件有關的若干問題:噪音降除、電路設計、PCB設計、麥克風的選擇、麥克風的安放、電源設計。
本方案主要由電話機芯片CD802加語音識別錄放模塊JT802構成
凌陽科技公司的最新產(chǎn)品SPCE061A.
凌陽科技公司的最新產(chǎn)品SPCE061A.
國際互聯(lián)網(wǎng)聯(lián)盟(W3C)日前宣布,兩種計算機語音互動規(guī)范將被列為國際標準開始實施。一直 以來,W3C都在通過多家技術企業(yè)進行評估的基礎上制定自己的標準。 VoiceXML 2.0是上述標準之一,目的是要提高網(wǎng)絡內(nèi)容
香港及新加坡,2002年4月24日──在多語種交談式語音理 解技術領域內(nèi)首屈一指的言豐科技今日宣布,其核心語音識別引擎——「言豐-語音識別引擎」榮 膺“新加坡全國資訊通信獎之最創(chuàng)新資訊通信產(chǎn)品/服務大獎”。