蘋果Siri正確率明顯提高 但仍落后于谷歌
5個(gè)月前,市場(chǎng)調(diào)研機(jī)構(gòu)Loup Ventures進(jìn)行了一項(xiàng)橫評(píng)測(cè)試,對(duì)象主要是多家科技公司的智能揚(yáng)聲器產(chǎn)品,一一測(cè)試這些產(chǎn)品針對(duì)不同問(wèn)題的表現(xiàn)如何。日前,該機(jī)構(gòu)又進(jìn)行了一項(xiàng)新的橫評(píng),而這一次測(cè)試對(duì)象是智能手機(jī)的AI智能語(yǔ)音助理。雖然Siri依然不算最出色的一款,但回到問(wèn)題的正確率卻得到了顯著提高。
為了得到更客觀的結(jié)果,Loup Ventures在測(cè)試過(guò)程中分別在智能手機(jī)上對(duì)蘋果Siri、谷歌Google Assistant、亞馬遜Alexa和微軟Cortana問(wèn)了800個(gè)問(wèn)題,并將測(cè)試結(jié)果與早期2017年4月的測(cè)試進(jìn)行對(duì)比。
在最新的測(cè)試中,蘋果的人工智能語(yǔ)音助理Siri能夠理解99%的問(wèn)題,并正確回答了78.5%的問(wèn)題。這是非常明顯的進(jìn)步,因?yàn)樵?017年4月時(shí)在類似的以AI為重點(diǎn)的測(cè)試的中,僅回答正確了66.1%。
Loup Ventures并沒(méi)有將這個(gè)成績(jī)與今年2月的測(cè)試對(duì)比,他們認(rèn)為智能音箱和智能手機(jī)之間有顯著差異,而這一次是純粹手機(jī)平臺(tái)的比拼。當(dāng)時(shí)針對(duì)HomePod的測(cè)試中,Siri只有在某些類型的問(wèn)題回答中表現(xiàn)出色,大量問(wèn)題仍僅限于能在揚(yáng)聲器上可執(zhí)行的操作上。因此在那次針對(duì)智能音箱的橫評(píng)中Siri只能墊底,因?yàn)?82道問(wèn)題的正確率卻只有52.3%。
Loup Ventures的評(píng)測(cè)主要根據(jù)兩個(gè)指標(biāo)來(lái)對(duì)每個(gè)智能語(yǔ)音助理評(píng)分:“它理解被問(wèn)的問(wèn)題嗎?”和“它給出了正確的回答嗎?”。這些問(wèn)題分為五個(gè)類別,包括地點(diǎn)(例如:“最近的咖啡店在哪里?”)、商務(wù)(“你能幫我訂購(gòu)新的紙巾嗎?”)、導(dǎo)航(“我如何坐公交到達(dá)市中心?”)、信息和命令。
關(guān)于測(cè)試的環(huán)境條件,Siri是運(yùn)行iOS 11.4系統(tǒng)的iPhone版,Google Assistant是Pixel XL手機(jī)版,Alexa是iOS版本,Cortana也是iOS版。至于結(jié)果,在“命令”問(wèn)題類別中Siri表現(xiàn)最出色,90%的問(wèn)題都回答正確了,優(yōu)于所有競(jìng)爭(zhēng)對(duì)手。而其他類別,“地點(diǎn)”問(wèn)題正確率為87%、“導(dǎo)航”類別83%,“信息”類別70%,“商務(wù)交易”僅60%。
其實(shí)Siri在“命令”這一問(wèn)題分類中領(lǐng)先并沒(méi)有什么奇怪的,因?yàn)閕OS是蘋果自家的封閉平臺(tái),通過(guò)Siri控制iPhone、智能家居、Apple Music等自然都能完成,而其他第三方app如Cortana和Alexa都有限制。說(shuō)實(shí)話,自家平臺(tái)做好是應(yīng)該的,至少確保用戶通過(guò)Siri能夠順利控制iPhone或在HomePod上播放音樂(lè),這的確已經(jīng)是很低的要求了。
而除了“命令”類別的問(wèn)題之外,Google Assistant在所有類別中都有明顯優(yōu)勢(shì),正確率最高。Loup Ventures稱贊谷歌語(yǔ)音搜索的“精選摘要”功能,因?yàn)榭梢酝ㄟ^(guò)語(yǔ)音讀取,關(guān)鍵是大多數(shù)情況下給出的都正好是想要的搜索結(jié)果。Alexa和Cortana在測(cè)試中表現(xiàn)不佳,畢竟iOS平臺(tái)限制了它們?cè)趇Phone上的發(fā)揮,基本僅限于app本身,無(wú)法達(dá)到Siri系統(tǒng)級(jí)別的執(zhí)行任務(wù)操作。
總的來(lái)說(shuō),在800個(gè)問(wèn)題測(cè)試中,Google Assistant回答問(wèn)題正確率達(dá)到了85.5%,并且理解所有的問(wèn)題。Siri的回答正確率為78.5%,有11個(gè)明顯錯(cuò)誤的回答。Alexa回答正確率為61.4%,13個(gè)錯(cuò)誤。而Cortana是最為落后,回答正確率僅為52.4%,錯(cuò)誤達(dá)到19個(gè)。
Loup Ventures表示,自2017年4月以來(lái)的15個(gè)月時(shí)間里,Siri回答問(wèn)題的正確率提高了13個(gè)百分點(diǎn)。當(dāng)iOS 12正式推出之后,伴隨著Siri捷徑功能的出世,相信Siri將獲得更多功能上的提升。