www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀] 本文基于毫米級全方位無回轉(zhuǎn)半徑移動機器人課題。微系統(tǒng)配置示意圖如圖1所示。主要由主機Host(配有圖像采集卡)、兩個CCD攝像頭(其中一 個為顯微攝像頭)、微移動裝配平臺、

 本文基于毫米級全方位無回轉(zhuǎn)半徑移動機器人課題。微系統(tǒng)配置示意圖如圖1所示。主要由主機Host(配有圖像采集卡)、兩個CCD攝像頭(其中一 個為顯微攝像頭)、微移動裝配平臺、微機器人本體和系統(tǒng)控制電路板等組成。計算機和攝像機組用于觀察微機器人的方位,控制系統(tǒng)控制微機器人的移動。

  本文在系統(tǒng)控制電路中嵌入式實現(xiàn)語音識別算法,通過語音控制微機器人。

機器人控制系統(tǒng)的資源有限,控制方法比較復(fù)雜,并且需要有較高的實時性,因此本文采用的語音識別算法必須簡單、識別率高、占用系統(tǒng)資源少。

HMM(隱馬爾可夫模型)的適應(yīng)性強、識別率高,是當前語音識別的主流算法。使用基于HMM非特定人的語音識別算法雖然借助模板匹配減小了識別所需的資源,但是前期的模板儲存工作需要大量的計算和存儲空間,因此移植到嵌入式系統(tǒng)還有一定的難度,所以很多嵌入式應(yīng)用平臺的訓(xùn)練部分仍在PC機上實現(xiàn)。

為了使訓(xùn)練和識別都在嵌入式系統(tǒng)上實現(xiàn),本文給出了一種基于K均值分段HMM模型的實時學(xué)習(xí)語音識別算法,不僅解決了上述問題,而且做到了智能化,實現(xiàn)了真正意義上的自動語音識別。

1 增量K均值分段HMM的算法及實現(xiàn)

由于語音識別過程中非特定的因素較多,為了提高識別的準確率,針對本系統(tǒng)的特點,采用動態(tài)改變識別參數(shù)的方法提高系統(tǒng)的識別率。

訓(xùn)練算法是HMM中運算量最大、最復(fù)雜的部分,訓(xùn)練算法的輸出是即將存儲的模型。目前的語音識別系統(tǒng)大都使用貝斯曼參數(shù)的HMM模型,采取最大似然度算 法。這些算法通常是批處理函數(shù),所有的訓(xùn)練數(shù)據(jù)要在識別之前訓(xùn)練好并存儲。因此很多嵌入式系統(tǒng)因為資源有限不能達到高識別率和實時輸出。

本系統(tǒng)采用了自適應(yīng)增量K均值分段算法。在每次輸入新的語句時都連續(xù)地計算而不對前面的數(shù)據(jù)進行存儲,這可以節(jié)約大量的時間和成本。輸入語句時由系統(tǒng)的識別結(jié)果判斷輸入語句的序號,并對此語句的參數(shù)動態(tài)地修改,真正做到了實時學(xué)習(xí)。

K均值分段算法是基于最佳狀態(tài)序列的理論,因此可以采用Viterbi算法得到最佳狀態(tài)序列,從而方便地在線修改系統(tǒng)參數(shù),使訓(xùn)練的速度大大提高。

為了達到本系統(tǒng)所需要的功能,對通常的K均值算法作了一定的改進。在系統(tǒng)無人監(jiān)管的情況下,Viterbi解碼計算出最大相似度的語音模型,根據(jù)這個假 設(shè)計算分段K均值算法的輸入?yún)?shù),對此模型進行參數(shù)重估。首先按照HMM模型的狀態(tài)數(shù)進行等間隔分段,每個間隔的數(shù)據(jù)段作為某一狀態(tài)的訓(xùn)練數(shù)據(jù),計算模型 的初始參數(shù)λ=f(a,A,B)。采用Viterbi的最佳狀態(tài)序列搜索,得到當前最佳狀態(tài)序列參數(shù)和重估參數(shù)θ,其中概率密度函數(shù)P(X,S|θ)代替 了最大似然度算法中的P(X,θ),在不同的馬爾科夫狀態(tài)和重估之間跳轉(zhuǎn)?;贙均值算法的參數(shù)重估流程如下:

  為了使參數(shù)能更快地收斂,在每幀觀察語音最佳狀態(tài)序列的計算結(jié)束后,加入一個重估過程,以求更快地響應(yīng)速度。

  可以看到,增量K均值算法的特點為:在每次計算完觀察值最佳狀態(tài)序列后,插入一個重估過程。隨時調(diào)整參數(shù)以識別下一個句子。

由于采用混合高斯密度函數(shù)作為輸出概率分布可以達到較好的識別效果,因此本文采用M的混合度對數(shù)據(jù)進行訓(xùn)練。

對λ重估,并比較收斂性,最終得到HMM模型參數(shù)訓(xùn)練結(jié)果。

可見,用K均值法在線修改時,一次數(shù)據(jù)輸入會有多次重估過程,這使系統(tǒng)使用最近的模型估計后續(xù)語句的最佳狀態(tài)序列成為可能。但是對于在線修改參數(shù)要求,快速收斂是很重要的。為了得到更好的Viterbi序列,最佳狀態(tài)序列使用了漸增的算法模型,即快速收斂算法。

語音識別的具體實現(xiàn)過程為:數(shù)字語音信號通過預(yù)處理和特征向量的提取,用戶通過按鍵選擇學(xué)習(xí)或者識別模式;如果程序進入訓(xùn)練過程,即用戶選擇進行新詞條 的學(xué)習(xí),則用分段K均值法對數(shù)據(jù)進行訓(xùn)練得到模板;如果進入識別模式,則從Flash中調(diào)出聲音特征向量,進行HMM算法識別。在識別出結(jié)果后,立即將識 別結(jié)果作為正確結(jié)果與前一次的狀態(tài)做比較,得到本詞條更好的模板,同時通過LED數(shù)字顯示和語音輸出結(jié)果。系統(tǒng)軟件流程如圖2所示。

[!--empirenews.page--]

  對采集到的語音進行16kHz、12位量化,并對數(shù)字語音信號進行預(yù)加重:

  L選擇為320個點,用短時平均能量和平均過零率判斷起始點,去除不必要的信息。

對數(shù)據(jù)進行FFT運算,得到能量譜,通過24通道的帶通濾波輸出X(k),然后再通過DCT運算,提取12個MFCC系數(shù)和一階二階對數(shù)能量,提取38個參數(shù)可以使系統(tǒng)識別率得到提高。

為了進行連接詞識別,需要由訓(xùn)練數(shù)據(jù)得到單個詞條的模型。方法為:首先從連接詞中分離出每個孤立的詞條,然后再進行孤立詞條的模型訓(xùn)練。對于本系統(tǒng)不定 長詞條的情況,每個詞條需要有一套初始的模型參數(shù),然后按照分層構(gòu)筑的HMM算法將所有詞串分成孤立的詞條。對每個詞條進行參數(shù)的重估,判斷是否收斂。如 果差異小于某個域值就判斷為收斂;否則將得到的參數(shù)作為新的初始參數(shù)再進行重估,直到收斂。

2 實驗結(jié)果

實驗采 用30個人(15男,15女)的聲音模型進行識別。首先由10人(5男,5女)對5個命令詞(前進、后退、左移、右移、快速)分別進行初始數(shù)據(jù)訓(xùn)練,每人 每詞訓(xùn)練10次,得到訓(xùn)練模板。然后再由這30人隨機進行非特定人語音識別。采用6狀態(tài)的HMM模型,高斯混合度選為14,得到圖3的實驗結(jié)果。

  逐步增加高斯混合度數(shù)目,可以得到圖4的實驗結(jié)果??梢姼咚够旌隙仍?8的時候達到較好的識別效果,混合度太高識別率反而會有所下降,這是由于嵌入式系統(tǒng)的資源有限,運算復(fù)雜度的增長超過了嵌入式設(shè)備的限制所造成的。

  為了使微機器人能夠正確地執(zhí)行人的聲音指令,本文將語音識別的過程嵌入微機器人的控制系統(tǒng)中,根據(jù)微機器人控制系統(tǒng)資源有限、對實時性要求高的 特點,使用增量K均值分段HMM的算法,簡化計算節(jié)省了所需的硬件資源,實現(xiàn)了實時學(xué)習(xí)的語音識別,能方便地對微機器人進行控制。

本系統(tǒng)的識別率達到了較高的標準,又由于加入了智能化的用戶選擇部分,用戶可隨時選擇學(xué)習(xí)新的語句,使其有更廣闊的應(yīng)用前景。
由于嵌入式平臺受到處理速度、存儲空間的限制,所以能夠?qū)ξC器人發(fā)出的指令十分有限,識別率還有待提高。因此,研究語音識別算法,比較各種算法的優(yōu)缺點,進而在嵌入式微機器人控制系統(tǒng)上實現(xiàn)大詞匯量非特定人的語音識別,實現(xiàn)真正意義上的人機交流是今后進一步的工作。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉