具有語(yǔ)音合成功能的嵌入式車載終端的設(shè)計(jì)
國(guó)外電子元器件1 引言
據(jù)廣州市公布的《2005年廣州市交通發(fā)展年度報(bào)告》統(tǒng)計(jì),2005年廣州市機(jī)動(dòng)車擁有量為177.4萬(wàn)輛;據(jù)《法制晚報(bào)》報(bào)道2006年5月份北京機(jī)動(dòng)車保有量可突破300萬(wàn)輛。奧運(yùn)時(shí)將突破330萬(wàn)輛;而據(jù)2006年gsm協(xié)會(huì)公布的一組數(shù)據(jù)稱:gsm手機(jī)用戶數(shù)量超過(guò)20億,中國(guó)市場(chǎng)最大。以上三組不同的數(shù)據(jù)顯示:越來(lái)越多的人在駕駛著機(jī)動(dòng)車并通過(guò)gsm終端與外界進(jìn)行通訊。
現(xiàn)階段,許多機(jī)動(dòng)車輛都安裝了車載終端。它主要用于車載導(dǎo)航、車輛調(diào)度、車載監(jiān)控等。而許多終端設(shè)備是依靠手工操作顯示終端來(lái)完成的,如駕駛員查看車輛調(diào)度中心或朋友發(fā)來(lái)的重要短消息。查看導(dǎo)航終端的地圖等。這樣就導(dǎo)致司機(jī)開車時(shí)不能專心,其直接后果可能導(dǎo)致嚴(yán)重的交通事故。
語(yǔ)音交流是人類最自然的交流方式,如果車載終端的很多操作可由實(shí)時(shí)的語(yǔ)音來(lái)代替的話,將有利于減少交通事故的發(fā)生率。例如,gsm modem收到短消息,司機(jī)不用手動(dòng)查看。語(yǔ)音合成系統(tǒng)可以自動(dòng)播報(bào)出來(lái);可以實(shí)時(shí)地提示司機(jī)行駛的方向與路名;可以實(shí)時(shí)地將交通狀況播報(bào)出來(lái)。讓駕駛員了解當(dāng)前交通狀況,通過(guò)了解道路交通擁堵的實(shí)時(shí)信息,從而避開擁堵路段,更快到達(dá)目的地等。語(yǔ)音合功能成的車載終端可提高車載終端的智能性、車輛駕駛的安全性和舒適性,使用戶使用起來(lái)更加方便,更具有人性化。2 語(yǔ)音合成及gsm m0dem2.1 語(yǔ)音合成技術(shù)
語(yǔ)音合成技術(shù)是利用計(jì)算機(jī)、智能系統(tǒng)等設(shè)備,按預(yù)定的程序和指令,人為產(chǎn)生音素、音節(jié)、詞和句子的技術(shù)。
目前,語(yǔ)音合成技術(shù)已發(fā)展到能實(shí)時(shí)地將任意文本轉(zhuǎn)換成連續(xù)可懂的自然語(yǔ)句輸出,相應(yīng)技術(shù)通常稱為文語(yǔ)合成或文語(yǔ)轉(zhuǎn)換(text to speech,簡(jiǎn)稱tts),涉及到聲學(xué)、語(yǔ)言學(xué)、語(yǔ)音數(shù)字信號(hào)處理技術(shù)、多媒體技術(shù)等多個(gè)學(xué)科。文語(yǔ)合成的原理:根據(jù)韻律建模的結(jié)果,從原始語(yǔ)音庫(kù)中取出相應(yīng)的語(yǔ)音基元,利用特定的語(yǔ)音合成技術(shù)對(duì)語(yǔ)音基元進(jìn)行韻律特性的調(diào)整和修改,最終合成出符合實(shí)際的語(yǔ)音。2.2 語(yǔ)音合成模塊
本設(shè)計(jì)采用安徽中科大訊飛信息科技有限公司研發(fā)的一款高端中文語(yǔ)音合成模塊xf-s4240。該模塊可通過(guò)uart、spi和12c三種接口接收待合成的文本,直接合成為語(yǔ)音輸出(line out)。
該模塊采用。intersound4.0 kt系統(tǒng)作為模塊內(nèi)核,一個(gè)是輕量級(jí)中文連續(xù)語(yǔ)音合成系統(tǒng)。
xf-s4240模塊的特點(diǎn)如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文單詞時(shí)按字母方式發(fā)音;支持四種內(nèi)碼格式:gb2312(簡(jiǎn)體中文編碼)、gbk(國(guó)家標(biāo)準(zhǔn)擴(kuò)展編碼)、unicode(字符編碼)、big5(繁體中文編碼);具有雙發(fā)音人:男聲、女聲;具有智能的文本分析處理算法,可正確識(shí)別和處理數(shù)值、號(hào)碼、時(shí)間日期及一些常用的度量衡符號(hào),具備較強(qiáng)多音字處理和中文姓氏處理能力;支持軟件調(diào)節(jié)語(yǔ)速、語(yǔ)調(diào)、音量等。 2.3 gsm modem
gsm modem是繼gsm手機(jī)后又一種非常重要的gsm移動(dòng)通信系統(tǒng)的終端設(shè)備。gsm modem作為一種主要的gsm網(wǎng)絡(luò)接入設(shè)備,它是傳統(tǒng)調(diào)制解調(diào)器與gsm無(wú)線移動(dòng)通信系統(tǒng)相結(jié)合的一種數(shù)據(jù)終端設(shè)備,因此也叫無(wú)線調(diào)制解調(diào)器。它的出現(xiàn)打開了gsm網(wǎng)絡(luò)數(shù)據(jù)通信及其應(yīng)用的大門。本設(shè)計(jì)采用西門子公司生產(chǎn)的第三代gsm雙頻modemtc35i,該模塊可廣泛應(yīng)用于pos終端、手持式設(shè)備、移動(dòng)電腦、無(wú)線電話、交通控制和導(dǎo)航系統(tǒng)、快速管理安全系統(tǒng)、遠(yuǎn)程監(jiān)視、遠(yuǎn)程抄表、自動(dòng)售賣機(jī)等系統(tǒng)。3 車載終端的硬件設(shè)計(jì)
系統(tǒng)硬件是以廣州周立功單片機(jī)發(fā)展有限公司的arm7系列smart arm2200嵌入式平臺(tái)為基礎(chǔ)。平臺(tái)主控制器采用飛利浦公司生產(chǎn)的16/32位arm7tdmi-s微控制器ipc2210,它具有豐富的外部接口,例如工業(yè)標(biāo)準(zhǔn)的uart、高速的i2c接口(400 kb/s)、spi接口、a/d轉(zhuǎn)換接口等,可以方便地與其他外設(shè)互連。
系統(tǒng)底層軟件采用μcliunx內(nèi)核,該內(nèi)核是針對(duì)微控制領(lǐng)域而設(shè)計(jì)的linux系統(tǒng),適合無(wú)內(nèi)存管理單元(mmu)的微控制器。
xf-s4240模塊可通過(guò)uart、spi和i2c接口實(shí)現(xiàn)與其他終端設(shè)備的通訊。本系統(tǒng)設(shè)計(jì)利用smartarm2200嵌入式平臺(tái)的i2c接口與xf-s4240的12c接口進(jìn)行通訊。xf-s4240設(shè)置為從設(shè)備,默認(rèn)地址為0x80,smart arm2200設(shè)置為主設(shè)備。gsm modem則通過(guò)標(biāo)準(zhǔn)uart口與smartarm2200嵌入式系統(tǒng)的通用串口2連接。4 軟件設(shè)計(jì)
4.1 語(yǔ)音模塊合成的通訊協(xié)議
無(wú)論xf-s4240采用uart、spi還是i2c與其他智能系統(tǒng)連接,語(yǔ)音合成模塊的上層通訊協(xié)議是相同的,下面將介紹語(yǔ)音合成的控制命令。
發(fā)送給xf-s4240的所有命令與數(shù)據(jù)均采用"幀"的方式進(jìn)行數(shù)據(jù)封裝后傳輸?! ∑渲?,幀頭長(zhǎng)度為一個(gè)字節(jié),定義為16進(jìn)制"0xfd";數(shù)據(jù)區(qū)長(zhǎng)度占兩個(gè)字節(jié),高字節(jié)在前,低字節(jié)在后。數(shù)據(jù)區(qū)長(zhǎng)度不定,但須小于1 024個(gè)字節(jié)。數(shù)據(jù)區(qū)包含命令字、命令參數(shù)和合成的語(yǔ)音信息。 此幀的含義:0xfd表示幀頭,0x00 0x0a表示數(shù)據(jù)區(qū)長(zhǎng)度為10個(gè)字節(jié)。0x01表示語(yǔ)音合成