截至7月12日,科大訊飛(002230.SZ)在蘋果App Store上傳的智能語音軟件“訊飛語點”依舊處于“Waiting For Review”(等待審核)狀態(tài)。
“訊飛語點6月20日提交,蘋果一直到7月5天日通知我們被拒絕上架,理由是我們沒有提供該App在使用中的視頻。”科大訊飛副總裁江濤告訴記者,一般蘋果的應(yīng)用僅需7-10天就上傳成功。
7月9日上午,科大訊飛又按照蘋果的要求拍了一段視頻繼續(xù)上傳訊飛語點。訊飛方面懷疑,蘋果可能是為其中文版Siri讓路,從而拒絕掉同類第三方產(chǎn)品上架。
7月11日,記者就訊飛語點在蘋果App Store被拒一事向蘋果中國區(qū)公關(guān)部致信詢問,截至發(fā)稿時尚未收到回復(fù)。
訊飛語點是一款針對個人用戶的智能語音手機軟件,可以實現(xiàn)語音控制打開網(wǎng)頁和程序等功能,和Siri很類似。此前,雖然已經(jīng)擁有訊飛語音輸入法等B2C產(chǎn)品,但科大訊飛主要收入仍來自B2B的行業(yè)應(yīng)用。該公司剛剛預(yù)告其上半年盈利將同比增長40%-50%,也是得益于其語音識別技術(shù)在全國各個行業(yè)的大面積應(yīng)用,尤其教育行業(yè)。據(jù)了解,由于技術(shù)領(lǐng)先,訊飛語音產(chǎn)品授權(quán)費用賣得很貴。
蘋果商店受阻
在此之前,訊飛在Android操作系統(tǒng)上推出了“訊飛語點”。訊飛副總江濤指出,之所以率先選在Android系統(tǒng)上線,是因為Android系統(tǒng)更加開放,能實現(xiàn)多任務(wù)調(diào)取,而蘋果iPhone版有許多功能被迫被放棄。
一位剛剛?cè)ビ嶏w考察過的某知名投資機構(gòu)副總裁向記者分析,即使訊飛的產(chǎn)品進入蘋果App Store,一樣面臨蘋果Siri的巨大競爭,因為蘋果將Siri集成在操作系統(tǒng)底層,它可以和其它蘋果應(yīng)用深度綁定。
未來將語音識別植入到手機系統(tǒng)底層是大勢所趨,蘋果、谷歌都已經(jīng)動手。除此之外,國內(nèi)的一些手機Android ROM廠商也在開發(fā)類似產(chǎn)品,把語音技術(shù)植入到操作系統(tǒng)深層。相比之下,訊飛的B2C手機軟件產(chǎn)品更多做成一個App,例如訊飛語點、訊飛輸入法、開心熊寶。
江濤表示,訊飛也試圖將自己的語音技術(shù)賣給蘋果,但由于種種原因未能如愿。蘋果目前用的是全球最大語音技術(shù)公司Nuance的產(chǎn)品。按照訊飛的說法,在中文識別技術(shù)上,訊飛要強于外來的Nuance。
“我們和蘋果的利益是一致的。”江濤指出,因為蘋果最核心的價值點還是在出售iPhone硬件上。他認為,訊飛語點能讓蘋果用戶獲得更好的體驗從而帶動蘋果硬件銷售。江濤表示,蘋果的Siri進來對訊飛是好事情,“蘋果的市場教育能力是我們不能比的”。
江濤指出,在盈利模式上,訊飛的B2C業(yè)務(wù)基本走互聯(lián)網(wǎng)的路線,而互聯(lián)網(wǎng)所有的產(chǎn)品基本特征都是要形成規(guī)模用戶,再根據(jù)服務(wù)的特點才形成價值。但他表示目前還不便透露具體的盈利模式,但公司已經(jīng)有較多的規(guī)劃。
一家同樣在將語音技術(shù)用于B2C領(lǐng)域的某移動互聯(lián)網(wǎng)公司高管則分析,目前移動互聯(lián)網(wǎng)的變現(xiàn)鏈條太長,更多的是作為長線的布局,因此這塊業(yè)務(wù)短期內(nèi)不會為訊飛帶來直接的收益。
對手入場
“訊飛的業(yè)務(wù),主要分為語音引擎和語音合成兩塊。”一位不久前剛剛?cè)ビ嶏w考察過的某知名投資機構(gòu)副總裁指出,目前訊飛的主要收入多來自語音合成這塊,語音引擎的收入剛剛開始。
語音引擎是將人講話的聲音識別出來,而語音合成則是用電腦模擬真人的說話。在語音合成方面,訊飛在國內(nèi)具有絕對的領(lǐng)先地位,而在語音引擎方面,訊飛可能面臨其他公司的競爭。語音引擎技術(shù)的關(guān)鍵在于算法和數(shù)據(jù)采樣。在算法上,國際上已經(jīng)有許多公開的資料、文獻,大家的水平差別不會太大。
真正奠定訊飛在語音引擎領(lǐng)域江湖地位的,是其國內(nèi)最全的語音數(shù)據(jù)庫。由于訊飛的產(chǎn)品最先在國內(nèi)大規(guī)模商用,因此相對于其它幾家的語音產(chǎn)品,訊飛的引擎在國內(nèi)應(yīng)用的范圍最廣、用戶最多,這讓訊飛積累了豐富的用戶語音數(shù)據(jù)——這些數(shù)據(jù)庫可以讓訊飛的語音識別更加準確。
“等到訊飛的語音數(shù)據(jù)庫積累到一定程度,數(shù)據(jù)就飽和了,就不會對其體驗改進起到什么新的作用,反而會加重其數(shù)據(jù)處理負擔(dān)。”國內(nèi)一家語音識別企業(yè)的高管指出,其它語音識別廠商的技術(shù)正在逐步追趕上訊飛,屆時有望打破訊飛在這一領(lǐng)域的壟斷。
對此江濤強調(diào),盡管競爭對手在追趕,但訊飛自己的語音技術(shù)也在不斷迭代發(fā)展中,訊飛對自己在技術(shù)上的領(lǐng)先抱有信心。
上述投資人近期曾挨個調(diào)研過國內(nèi)主要的語音識別企業(yè),他認為北京的納象立方和另一個從盛大出來創(chuàng)業(yè)的團隊都可能是訊飛的強勁對手。
其中北京納象立方已在業(yè)內(nèi)小有名氣,該公司由松禾資本投資,納象立方的技術(shù)在電視臺等媒體中應(yīng)用廣泛,中央電視臺和北京電視臺都是其客戶,主要用于電視臺便利地進行字幕制作,該公司也有較強的技術(shù)積累。
另外一個從盛大出來的團隊的技術(shù)實力也很強。這個團隊此前在摩托羅拉進行語音技術(shù)的開發(fā),其負責(zé)人名叫黃偉。摩托羅拉的語音識別團隊曾經(jīng)在業(yè)內(nèi)有很高的地位,但在金融危機期間,摩托的整個語音識別團隊被賣給了Nuance——全球排名第一的語音技術(shù)供應(yīng)商。
黃偉于2009年7月加入盛大網(wǎng)絡(luò)旗下的創(chuàng)新院,并于2010年10月創(chuàng)建了語音分院。2010年五月,他帶領(lǐng)團隊參加由美國國家標(biāo)準技術(shù)署主辦的“聲紋識別評測(Speaker Recognition Evaluation, SRE )”大賽,取得綜合排名第一的好成績,力壓美國麻省理工、斯坦福等名校和機構(gòu),并在一些國際比賽中力壓科大訊飛。
但在此后,黃偉由于種種原因離開了盛大創(chuàng)業(yè),他帶領(lǐng)的這一團隊在投資界估值非常之高。有消息稱,黃偉的團隊近期剛剛獲得某上市公司CEO的投資。
上述投資人指出,在B2C業(yè)務(wù)上,訊飛的真正對手可能是國內(nèi)的互聯(lián)網(wǎng)公司。不管是騰訊、百度還是盛大,都非常重視語音這塊業(yè)務(wù)。
2010年,騰訊宣布2億打造合肥研發(fā)中心,此后又成立了全資子公司合肥世紀訊微,開發(fā)和訊飛類似的語音技術(shù)。知情人士透露,該公司的辦公樓就在訊飛斜對面,并已經(jīng)從訊飛挖走了幾十號人。在利用語音技術(shù)通過互聯(lián)網(wǎng)變現(xiàn)方面,騰訊、百度等顯然有著更豐富的經(jīng)驗。
“我們和國內(nèi)的主要互聯(lián)網(wǎng)公司都有合作,主要是賣授權(quán)的方式。”江濤強調(diào),訊飛和互聯(lián)網(wǎng)巨頭之間是合作關(guān)系。[!--empirenews.page--]