IBM 送給 AI 開發(fā)者的禮物:傻萌的入門級 Watson 機器人
Watson 開發(fā)者大會上,IBM 發(fā)布了 TJBot ——能組裝出上圖所示紙板機器人的 DIY 工具組合。可不要因為傻萌、簡陋的外表小看它,它本質上是基于 Watson 的可編程 AI 。早在發(fā)布紙箱版本之前,遍布全球的開發(fā)者就已創(chuàng)造出激光切割和 3D 打印的 TJBot:包括南非、肯尼亞、意大利、德國、瑞士、巴基斯坦、加拿大和香港。多個開發(fā)者團隊表示有興趣與 IBM 合作,為 TJBot 設計新的使用場景:從用于機器人/認知課程的教學,到關懷老年人、開發(fā)談話代理的企業(yè)級解決方案。
IBM 發(fā)布的如何制作 TJBot、如何對 它編程的指令集(被稱為“菜單”),在 Instructables 在線開發(fā)者社區(qū)廣受好評。該項目在社區(qū)主要頁面都有體現(xiàn),并已收到 21000 份用戶評論。TJBot 被各種層次的開發(fā)者所接受,從初學者到專家。大家用它來創(chuàng)建能學習、推理、與人自然交互的認知對象。
簡化設計——為開發(fā)者而開發(fā)
TJBot 項目的初衷,是成為用戶體驗和試驗“具象化認知”的入門素材。“具象化認知”是指把 AI 技術植入到它已經(jīng)在與之交互的設備、物體、空間里。如果這個過程足夠簡單,用戶們會創(chuàng)造出什么來呢?會產(chǎn)生什么樣的設計思路?TJBot 幫助尋找這些問題的答案。作為大家都買得起的 DIY 工具,它把“具象化認知”的創(chuàng)新過程民主化。
為了這一目標, TJBot 項目的一個指導原則是“簡單”。這在硬件零件,和編程語言平臺的選擇上得到體現(xiàn)。從最基本的原型機工具入手,IBM 測試了各種 LED,麥克風、揚聲器和伺服電機;最后選擇出小巧、功能多樣但又容易上手的模型。同樣地,控制這些傳感器的軟件使用 Nodejs 編寫,它是一個用 JavaScript 開發(fā)軟件應用的開源、跨平臺的運行環(huán)境。
借助傳感器和 Watson 實現(xiàn)多種功能:
作為原型機,TJBot 的技能樹正在不斷擴展:它現(xiàn)在已經(jīng)能說話、進行語音識別、揮手和跳舞。這些能力由它內置的傳感器、以及一系列認知服務來實現(xiàn)。比如,TJBot 的說話功能由 Watson 文字到語音服務在軟件層面完成,然后通過揚聲器播放出來。同樣的, Watson 語音到文字服務,以及 TJBot 的麥克風,組合起來使它能進行語音識別。這些技能可以被進一步組合,創(chuàng)造出新的應用場景,比如說創(chuàng)建虛擬代理或者數(shù)字助手。
新增加菜單
目前,TJBot 在 Github 的工具庫包含三個基本“菜單”:讓 TJBot 對簡單語音命令做出回應的代碼,分析推文的情緒并回復,還有讓 TJBot 作為談話代理。社區(qū)的開發(fā)者們由為它加入了兩個菜單:TJWave 和 Swifty TJ。TJwave 很有趣,它展示給開發(fā)者如何控制 TJBot 的手臂。它還包含額外功能:讓 TJBot 隨音樂“起舞”:TJBot 會播放一段音樂文件,提取其中的節(jié)拍和峰值,然后隨之揮手。控制 TJBot 的小短手還能用來使語音交互更生動,以及模仿人類說話時的手部動作。Swifty TJ 展示了如何用 Swift 語言控制 TJBot 上的 LED。隨著 TJBot 的菜單目錄不斷擴大,Swifty TJ 為 Swift 開發(fā)者給 TJBot 寫代碼提供了出發(fā)點。
下一步
2017 年,IBM 將專注于在三個領域提升 TJBot:開發(fā),維護和學習。
開發(fā):IBM 會不斷對現(xiàn)有菜單進行改進,同時探索紙板機器人的新技能。一個例子是:IBM 剛剛利用 TJBot 的攝像頭傳感器(配合相關軟件應用)實現(xiàn)了它的視覺識別能力。
維護:發(fā)展并維護 TJBot 開發(fā)者社區(qū),把 TJBot 介紹給新用戶,分享新菜單、用戶難題和反饋。
學習:或許,這是下一步最重要的事。這包含對開發(fā)者使用體驗、終端用戶使用體驗的調查研究,以提供更好的設計思路和對認知應用的設計指導。