人工智能關(guān)鍵技術(shù):模式識(shí)別
人工智能技術(shù)應(yīng)該是當(dāng)今計(jì)算機(jī)技術(shù)中最熱門、發(fā)展最快的技術(shù)。而人工智能技術(shù)也是計(jì)算機(jī)最重要的一個(gè)發(fā)展方向和趨勢(shì)。人工智能雖然發(fā)展了幾十年,但是現(xiàn)在仍然人工智能技術(shù)應(yīng)該是當(dāng)今計(jì)算機(jī)技術(shù)中最熱門、發(fā)展最快的技術(shù)。而人工智能技術(shù)也是計(jì)算機(jī)最重要的一個(gè)發(fā)展方向和趨勢(shì)。當(dāng)人類無(wú)法勝任工作任務(wù)或需要放松休息時(shí),只有機(jī)器人可以高效且不知疲憊的替代人類工作,并且?guī)椭祟惤档驮谀承┕ぷ黝I(lǐng)域的風(fēng)險(xiǎn)。如今人工智能的發(fā)展成為如今科技發(fā)展的趨勢(shì)。
而計(jì)算機(jī)網(wǎng)絡(luò)與人工智能的結(jié)合構(gòu)成了新的Web3.0,它是新一代的網(wǎng)頁(yè)標(biāo)準(zhǔn),是一個(gè)人工智能的網(wǎng)絡(luò),也叫語(yǔ)義網(wǎng)。人工智能的關(guān)鍵技術(shù)是模式識(shí)別,而且在當(dāng)今有著廣泛的應(yīng)用。模式識(shí)別主要有文字識(shí)別、語(yǔ)音識(shí)別和圖像識(shí)別技術(shù)。
文字識(shí)別最常見(jiàn)的是手寫輸入和光學(xué)字符識(shí)別(OCR)手寫輸入到現(xiàn)在為止已經(jīng)發(fā)展得非常成熟,我們經(jīng)常使用手機(jī)的手寫輸入來(lái)錄入文字,識(shí)別的準(zhǔn)確率已經(jīng)達(dá)到了98%,特別是對(duì)于老人和小孩這種不會(huì)打字的人群使用手機(jī)和平板提供了方便,也讓電腦、平板和智能手機(jī)擁有了更大的用戶群。不僅僅是比爾·蓋茨在四十年前所預(yù)言的:“我要讓世界上每一個(gè)家庭都擁有計(jì)算機(jī)”,可能在將來(lái)的某一天,我們每一個(gè)人都可以擁有計(jì)算機(jī)、平板或手機(jī)。
光學(xué)字符識(shí)別系統(tǒng)(OCR):早期掃描儀用的非常廣泛,但是掃描的文檔信息卻是一張圖片,不是文字,怎樣將掃描的文檔識(shí)別為文字呢?光學(xué)字符識(shí)別系統(tǒng)就是將圖片識(shí)別為單個(gè)可編輯的文字的軟件,但是因?yàn)閿?shù)碼相機(jī)和手機(jī)相機(jī)的大量使用,掃描儀現(xiàn)今使用的并不廣泛。而光學(xué)字符識(shí)別系統(tǒng)識(shí)別的準(zhǔn)確率并不高,在字體發(fā)生變化,字體大小太小,文本背景不是純白色時(shí)識(shí)別起來(lái)都會(huì)出現(xiàn)問(wèn)題。這就是為什么我們注冊(cè)時(shí)使用的驗(yàn)證碼都是那些看得不太清楚的字符,它就是為了防止機(jī)器識(shí)別,造成惡意大量注冊(cè)。要是光學(xué)字符識(shí)別能達(dá)到很高的準(zhǔn)確率,那么文本型的驗(yàn)證碼也就會(huì)從此消失了。
語(yǔ)音識(shí)別語(yǔ)音識(shí)別應(yīng)該是所有模式識(shí)別技術(shù)中最關(guān)鍵和最重要的技術(shù)。一旦語(yǔ)音識(shí)別能達(dá)到高級(jí)階段,人工智能也就很容易達(dá)到高級(jí)階段。因?yàn)檎Z(yǔ)音技術(shù)可以直接將人的語(yǔ)音轉(zhuǎn)換成命令,而計(jì)算機(jī)或機(jī)器人一旦執(zhí)行對(duì)應(yīng)的命令就能完成我們的任務(wù)。例如:你說(shuō)話,機(jī)器人如果能識(shí)別你的語(yǔ)音,就能將你的語(yǔ)音轉(zhuǎn)換成命令進(jìn)行執(zhí)行,就能完成你的任務(wù),那時(shí)機(jī)器人為你上課、為你就醫(yī)、為你做飯、為你打掃衛(wèi)生、為你工作都不是難事了。所以語(yǔ)音識(shí)別技術(shù)是模式識(shí)別,同時(shí)也是人工智能的關(guān)鍵技術(shù)。
語(yǔ)音識(shí)別技術(shù)最常見(jiàn)的是語(yǔ)音輸入,我們說(shuō)話,就能對(duì)應(yīng)為我們將語(yǔ)音轉(zhuǎn)換為文字進(jìn)行錄入,語(yǔ)音識(shí)別沒(méi)有手寫輸入識(shí)別率高,但是語(yǔ)音識(shí)別的效率更高,錄入的更快。
微軟在Windows10中加入的核心技術(shù)Cortana(微軟小娜)就是語(yǔ)音識(shí)別技術(shù)。
蘋果公司的Siri也是語(yǔ)音識(shí)別技術(shù),而且是蘋果公司的重大創(chuàng)新和大力發(fā)展的一項(xiàng)人工智能技術(shù)。
Google和百度的語(yǔ)音搜索以及Google公司的語(yǔ)音翻譯軟件都是語(yǔ)音識(shí)別技術(shù)。
圖像識(shí)別圖像識(shí)別技術(shù)在近幾年發(fā)展特別快,技術(shù)也相對(duì)比較成熟。圖像識(shí)別技術(shù)比較常見(jiàn)的指紋識(shí)別、人臉識(shí)別、圖像搜索技術(shù)已得到了廣泛的應(yīng)用。
指紋識(shí)別在手機(jī)上成了標(biāo)配,上班打卡一般都是用的指紋機(jī)。
人臉識(shí)別是近兩年來(lái)快速發(fā)展的技術(shù),由于人臉識(shí)別的廣泛應(yīng)用,第三代身份證在有的城市已經(jīng)出現(xiàn),它變成了電子的人臉識(shí)別身份驗(yàn)證。人臉識(shí)別不僅應(yīng)用于門禁系統(tǒng),而且支付系統(tǒng)的廣泛應(yīng)用,身份真實(shí)性驗(yàn)證也得益于人臉識(shí)別技術(shù)的成熟。
圖像搜索功能也得到了快速的發(fā)展,相機(jī)拍片搜索技術(shù)也在應(yīng)用。公安系統(tǒng)通過(guò)在幾萬(wàn)甚至幾十萬(wàn)中對(duì)比犯人的圖片搜索定位正在得到廣泛應(yīng)用。旅游景區(qū)的圖像搜索跟蹤人物讓小孩走丟情況不再是難題。
計(jì)算機(jī)技術(shù)的發(fā)展推動(dòng)了社會(huì)的進(jìn)步,計(jì)算機(jī)技術(shù)代替人類的體力勞動(dòng)甚至是腦力勞動(dòng)。而人工智能的出現(xiàn)則是讓計(jì)算機(jī)發(fā)展達(dá)到一個(gè)更高級(jí)的階段,人工智能的廣泛應(yīng)用,需要有模式識(shí)別技術(shù)的重大突破和創(chuàng)新,而模式識(shí)別中的文字識(shí)別、圖像識(shí)別和語(yǔ)音技術(shù)正在快速發(fā)展,其核心語(yǔ)音識(shí)別技術(shù)也得到了廣泛的應(yīng)用。