全球智能機器人的市場規(guī)模預計在2021年將成長至336億美元,而亞洲將是成長最多的地區(qū)。近年各國都不約而同將機器人視為戰(zhàn)略產(chǎn)業(yè),某種程度甚至可以是一種綜合國力的展現(xiàn),各領(lǐng)域的領(lǐng)導廠商都積極投入并發(fā)展當中。
機器人無疑已成為下一個科技明日之星,全球各國無不積極推動機器人產(chǎn)業(yè),而近期人工智能與深度學習等技術(shù)發(fā)展熱度增溫,更成為推動智能機器人發(fā)展的重要動能。根據(jù)工研院IEK研究報告預估,全球智能機器人的市場規(guī)模預計在2021年將成長至336億美元,而亞洲將是成長最多的地區(qū)。
根據(jù)財團法人精密機械研究發(fā)展中心的定義,智能機器人可透過傳感器感知環(huán)境,并藉由程序化處達成智能化理解,最后反應出所需動作,以執(zhí)行各種生產(chǎn)活動、提供服務或與人互動。它是集合各種技術(shù)于一體的平臺,包含機械、控制自動化、電子、電機、影像、光學、通訊、軟件與安全系統(tǒng)等相關(guān)技術(shù)與應用,其中軟硬件整合技術(shù)至為重要。本課程深入探討智慧機器人產(chǎn)業(yè)前景,并剖析關(guān)鍵技術(shù)、零組件與軟硬件架構(gòu)。
服務機器人具發(fā)展?jié)摿?根據(jù)資策會MIC研究數(shù)據(jù)顯示(圖1),2015年四大應用領(lǐng)域機器人市場規(guī)模合計約269億美元,其中以工業(yè)機器人110億美元比重最高,但到了2025年整體市場規(guī)模將擴大到669億美元,盡管市場規(guī)模還是以工業(yè)機器人的244億美元最大,但商業(yè)用機器人與個人用機器人2000∼2025年復合成長率(CAGR)分別為11.6%與17.4%,資策會MIC產(chǎn)業(yè)分析師張佳蕙(圖2)指出,尤其是2015年以后,這兩類應用成長更為顯著,服務型應用市場當中,有許多過去未導入機器人的新興領(lǐng)域,帶動其成長潛力。
圖1 2000∼2025年全球各應用領(lǐng)域機器人產(chǎn)業(yè)規(guī)模 數(shù)據(jù)源:BCG,2014;資策會MIC,2016/1
圖2 資策會MIC產(chǎn)業(yè)分析師張佳蕙指出,2015年以后,服務型應用市場,有許多過去未導入機器人的新興領(lǐng)域,帶動其成長潛力。
日本軟件銀行近年大舉進軍機器人領(lǐng)域,一連串的動作引發(fā)市場關(guān)注,張佳蕙說,包括2012年收購法國人形機器人公司Aldebaran RoboTIcs,其2014年推出的人形機器人Pepper陸續(xù)與IBM Watson、Microsoft Azure合作。Softbank提出以溝通為基礎(chǔ)提供家庭及商業(yè)應用的愿景,Pepper被設定為「希望能被愛」的機器人,透過互動溝通了解家中成員,成為家中的一份子;并在人工智能的基礎(chǔ)下,讓Pepper協(xié)助企業(yè)產(chǎn)品的營銷,在家庭兼具娛樂及學習效果。此外,目前較知名已投入市場的服務型機器人還有Leka與Savioke。
近年各國都不約而同將機器人視為戰(zhàn)略產(chǎn)業(yè),日本發(fā)展機器人已久,2015年日本政府設立機器人革命倡議協(xié)議會,推動機器人產(chǎn)業(yè)的發(fā)展;韓國則是由產(chǎn)業(yè)通商資源部主導,每五年制定基本計劃,目標是在2022年成為機器人活用的國家,生產(chǎn)規(guī)模達25兆韓圜;美國則是從2011年開始,由美國國家科學基金會(NSF)主導,發(fā)展能夠安全與人協(xié)同工作的機器人技術(shù)。目前韓國以家用機器人為發(fā)展主力,美國則是在救災國防領(lǐng)先各國,張佳蕙建議,家庭應用與公共應用各國布局已深,商業(yè)應用近期興起,臺灣可以伺機切入。
深度學習、語音識別等技術(shù)在近年有顯著的發(fā)展,也因此促成服務型機器人產(chǎn)業(yè)與應用的興起,機器人從過去單向溝通執(zhí)行命令,進化到可以理解語意響應對話內(nèi)容,應用服務為機器人后續(xù)發(fā)展重點。機器人應用情境多元,在不同場合必須結(jié)合各領(lǐng)域?qū)I(yè)知識及對用戶需求的了解,因此廠商應透過開放平臺,加快機器人在各領(lǐng)域的應用。
類神經(jīng)網(wǎng)絡技術(shù)大躍進深度學習這個名詞因為2016年人工智能AlphaGo連敗南韓棋王,機器首度成功挑戰(zhàn)人腦,并在圍棋這個普遍被認為難度最高的博弈活動中,一時又被世界大眾所關(guān)心。而AlphaGo的深度學習核心就是類神經(jīng)網(wǎng)絡技術(shù),早在1943年,Warren McCulloch以及Walter Pitts首次提出神經(jīng)元的數(shù)學模型,之后到了1958年,心理學家Rosenblatt提出了感知器(Perceptron)的概念,在前者神經(jīng)元的結(jié)構(gòu)中加入了訓練修正參數(shù)的機制,這時類神經(jīng)網(wǎng)絡的基本學理架構(gòu)算是完成。類神經(jīng)網(wǎng)絡的神經(jīng)元其實是從前端收集到各種訊號(類似神經(jīng)的樹突),然后將各個訊號根據(jù)權(quán)重加權(quán)后加總,再透過活化函數(shù)轉(zhuǎn)換成新訊號傳送出去(類似神經(jīng)元的軸突)。
相關(guān)技術(shù)架構(gòu)其實早在1970年代就已經(jīng)完成了,數(shù)據(jù)決策技術(shù)長尹相志(圖3)表示,深度學習其實就是類神經(jīng)網(wǎng)絡的另一種說法,其成功來自于更深入理解人類大腦的運作。卷積神經(jīng)網(wǎng)絡(ConvoluTIonal Neural Network)協(xié)助機器發(fā)展真正的視覺,其中的兩大原則為:局部感知與權(quán)重共享。讓機器可以從碎片特征理解整體意義,進而找出特征的群聚性,不斷分層細化的分析,無論是多細微的特征:只要不化成灰,都能抽取特征。
圖3 數(shù)據(jù)決策技術(shù)長尹相志表示,深度學習技術(shù)架構(gòu)1970年代就完成了,其成功來自于更深入理解人類大腦的運作。
其中,圖形辨識是其中的重點,在過往的認知中,中央處理器(CPU)與繪圖處理器(GPU)處理不同的運算功能,單就圖形辨識的深度學習功能來說,GPU的效能是CPU的百至千倍,尹相志進一步表示,透過深度學習,機器甚至可以將原本馬賽克圖案的照片效果移除還原。不過,在語音與文字的辨識上,中文對于機器還是很大的挑戰(zhàn),中文詞匯超過百萬,無須約定成俗即可創(chuàng)造新字以及賦予詞性,還有很多中英、中日、中韓夾雜的詞匯,諸如:藍瘦、香菇、94狂等。
大廠搜集資料布局未來機器人產(chǎn)業(yè)前景受到各方矚目,尤其深度學習、人工智能成為各大廠布局下一波企業(yè)發(fā)展的方向,包括臉書(Facebook)、微軟(Microsoft)、谷歌(Google)與亞馬遜(Amazon)。這些企業(yè)的共通點就是都透過產(chǎn)品、服務與消費者互動,并累積了多年的初級數(shù)據(jù),未來人工智能與深度學習說穿了都是大量資料搜集、整理并分類、標注(Tag)使這些初級數(shù)據(jù)變成信息,最后再透過強大的處理器快速搜尋與反應的結(jié)果。
從這樣的架構(gòu)來觀察,碩網(wǎng)信息總經(jīng)理邱仁鈿(圖4)認為,四大廠之間FB的數(shù)據(jù)結(jié)構(gòu)化程度最高,因為每個用戶上傳文章或圖片時,已經(jīng)將內(nèi)容整理過,圖片分辨率高甚至照片中的人物也直接標注了,未來FB要藉由這些數(shù)據(jù)做進一步整理或利用時,可以花費最少的時間,或進行更高質(zhì)量的整理。目前世界上有80%的數(shù)據(jù)數(shù)據(jù)是非結(jié)構(gòu)化的,認知運算能夠提升并簡化學習過程。
圖4 碩網(wǎng)信息總經(jīng)理邱仁鈿認為,目前世界上有80%的數(shù)據(jù)數(shù)據(jù)是非結(jié)構(gòu)化的,認知運算能夠提升并簡化學習過程。
因此,機器人要降低錯誤率重點就在數(shù)據(jù)的完整性與結(jié)構(gòu)化,邱仁鈿進一步解釋,深度學習的應用歷程從底層的類神經(jīng)網(wǎng)絡運算、大量數(shù)據(jù)分析、發(fā)現(xiàn)規(guī)則/自動歸類、產(chǎn)生媒合/推薦策略、記錄用戶行為、回饋到模型/提升準確率,最終就是要提升數(shù)據(jù)質(zhì)量并產(chǎn)生自我學習修正機制。