www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 嵌入式 > 嵌入式教程
[導讀]基于HMM的連續(xù)小詞量語音識別系統(tǒng)的研究

摘要:為了提高語音識別效率及對環(huán)境的依賴性,文章對語音識別算法部分和硬件部分做了分析與改進,采用ARMS3C2410微處理器作為主控制模塊,采用UDA1314TS音頻處理芯片作為語音識別模塊,利用HMM聲學模型及Viterbi算法進行模式訓練和識別,設(shè)計了一種連續(xù)的、小詞量的語音識別系統(tǒng)。實驗證明,該語音識別系統(tǒng)具有較高的識別率和一定程度的魯棒性,實驗室識別率和室外識別率分別達到95.6%,92.3%。
關(guān)鍵詞:語音識別;嵌入式系統(tǒng);Hidden Markov Models;ARM;Viterbi算法

0 引言
    嵌入式語音識別系統(tǒng)是應(yīng)用各種先進的微處理器在板級或是芯片級用軟件或硬件實現(xiàn)的語音識別。嵌入式技術(shù)與語音識別技術(shù)相結(jié)合,能使人們甩掉鍵盤,通過語音命令對智能化終端進行操作,人與智能化終端之間的這種自然快捷的交互方式有助于提高人機交互的效率,以適應(yīng)嵌入式平臺存儲資源少,實時性要求高的特點,增強人對智能化設(shè)備的控制,同時,在語音識別技術(shù)發(fā)展過程中又以HMM的廣泛應(yīng)用為特點。該算法通過對大量語音數(shù)據(jù)進行數(shù)據(jù)統(tǒng)計,建立識別詞條的統(tǒng)計模型,然后從待識別語音中提取特征,與這些模型匹配,通過比較匹配概率,以獲得識別結(jié)果,通過建立大量的語音數(shù)據(jù)庫,就能獲得一個穩(wěn)健的統(tǒng)計模型,提高在各種實際情況下的識別效率。

1 Markov鏈及隱馬爾可夫模型(HMM)
    語音信號是一個可觀察的序列,在足夠小時間段上特性近似于穩(wěn)定,但其總的過程可看作依次從相對穩(wěn)定的某一特性過渡到另一特性,在整個分析區(qū)間內(nèi)可將許多線性模型串接起來,這就是Markov鏈。Markov鏈是Markov隨機過程的特殊情況,即Markov鏈式狀態(tài)和時間參數(shù)都離散的Markov過程。
    隱馬爾可夫模型是對語音信號的時間序列結(jié)構(gòu)建立統(tǒng)計模型,可將之看作一個數(shù)學上的雙重隨機過程:一個是用具有有限狀態(tài)數(shù)的Mar-kov鏈來模擬語音信號統(tǒng)計特性變化的隱含的隨機過程,另一個是與Mark-ov鏈的每一個狀態(tài)相關(guān)聯(lián)的觀測序列的隨機過程。前者通過后者表現(xiàn)出來,但前者的具體參數(shù)是不可測的。
    一般來說,一個HMM是一個雙重隨機過程,由下述五個參數(shù)描述:


2 基于HMM的語音識別系統(tǒng)實現(xiàn)
    人的言語過程實際上就是一個雙重隨機過程,語音信號本身是一個可觀測的時變序列,是由大腦根據(jù)語法知識和言語需要(不可觀測的狀態(tài))發(fā)出音素的參數(shù)流。HMM合理地模仿了這一過程,很好地描述了語音信號的整體非平穩(wěn)性和局部平穩(wěn)性,是較為理想的一種語音模型。從整段語音來看,人類語音是一個非平穩(wěn)的隨機過程,但是若把整段語音分割成若干短時語音信號,則可認為這些短時語音信號是平穩(wěn)過程,就可以用線性手段對這些短時語音信號進行分析。若對這些語音信號建立隱馬爾可夫模型,則可以辯識具有不同參數(shù)的短時平穩(wěn)信號段,并可以跟蹤它們之間的轉(zhuǎn)化,從而解決了對語音的發(fā)音速率及聲學變化建立模型的問題。
    語音識別系統(tǒng)首先通過芯片內(nèi)的A/D轉(zhuǎn)換器將模擬語音信號轉(zhuǎn)化為數(shù)字語音信號,然后對數(shù)字語音信號進行處理(信號加窗、過濾),得到干凈的語音信號,再通過特征提取過程做出特征矢量,提取語音特征,最后由識別過程對說話人語音進行識別,得出識別結(jié)果??傮w來說,整個識別過程分為語音信號的預處理、語音信號的特征提取、語音庫的建立以及語音信號的識別等幾個主要階段,如圖1所示。


    語音識別過程分為兩個部分:一是HMM訓練過程,得到HMM語音識別模型,即建立基本識別語音庫;二是HMM識別過程,得到語音識別結(jié)果。[!--empirenews.page--]
2.1 HMM訓練
    HMM算法是解決識別問題的一種常用方法。一個HMM模型中有N個狀態(tài),對于一個長度為T的觀察序列,如果按照定義來計算,需要2TNT次運算,這種運算量是不能接受的,而HMM算法可以簡化這個過程。


[!--empirenews.page--]


    如果P(O/λZ)和距離太大,則返回步驟(2),反復迭代運算,直到HMM模型參數(shù)不再發(fā)生明顯的變化為止。
2.2 HMM模型識別
    HMM模型的輸出概率用Viterbi算法計算,因為概率值一般都遠小于1,這里用取對數(shù)后的概率作為輸出值:

    以上式中δt(i)表示t時刻第i個狀態(tài)的累積輸出概率;φt(i)表示t時刻第i個狀態(tài)的前續(xù)狀態(tài)號;為最優(yōu)狀態(tài)序列中t時刻所處的狀態(tài);P*為最終的輸出概率。

3 實驗結(jié)果
    系統(tǒng)首先通過語音錄入模塊的麥克風將語音信號輸入UDA1341 TS數(shù)字音頻處理芯片,通過S3C2410向UDA1341數(shù)字音頻處理芯片發(fā)送指令,數(shù)字音頻處理芯片由內(nèi)部A/D對語音信號進行采樣,調(diào)用語音壓縮算法對語音信號進行壓縮,并調(diào)用語音識別函數(shù)API對輸入語音進行基于模式匹配算法的語音識別,最終UDA1341數(shù)字音頻處理芯片將識別結(jié)果通過I/O傳送到ARM S3C2410,S3C2410接收到識別結(jié)果后,根據(jù)不同的識別結(jié)果再向UDA1341 TS發(fā)送不同指令,以此實現(xiàn)語音識別系統(tǒng)的功能。
    系統(tǒng)采用三星的S3C2410作為嵌入式CPU,這是一款高性價比、低功耗、高性能、高集成度的CPU,基于ARM9核,主頻為203 MHz,專為網(wǎng)絡(luò)通信和手持設(shè)備而設(shè)計,能滿足語音識別系統(tǒng)中的低成本、低功耗、高性能、小體積的要求。
    實驗采用10字中文數(shù)碼,分別在室外環(huán)境和實驗室環(huán)境下測試,結(jié)果如表1所示。


    通過測試表明,在實驗室環(huán)境下該系統(tǒng)在UDA1314TS DSP芯片上得到的結(jié)果比較令人滿意,具有良好的魯棒性,識別率達到實用要求,但在室外較高噪音條件下的識別率相對實驗室環(huán)境下有一定差距,滿足語音識別基本要求。

4 結(jié)論
    本文系統(tǒng)采用隱馬爾可夫模型的語音識別算法,能夠?qū)π≡~量、連續(xù)語音進行識別,識別率較高。ARMS3C2410微處理器和UDA1314TS音頻處理芯片的結(jié)合應(yīng)用,能使本語音識別系統(tǒng)具有較強的實時性。體積小,攜帶方便,使用靈活,可移植性強的特點使系統(tǒng)在進一步改進和發(fā)展后能夠用于工業(yè)語音控制領(lǐng)域中,還可用于聲控玩具、聲控設(shè)備等人們的日常生活中。
    但由于技術(shù)水平和硬件環(huán)境的限制,該語音識別系統(tǒng)在算法、硬件方面都需要進一步的研究和完善。該嵌入式語音識別系統(tǒng)的研究為進一步開發(fā)和研究實用性嵌入式語音識別系統(tǒng)做出了重要的嘗試和探索工作。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉