機器學(xué)習(xí)為許多深受歡迎的Google應(yīng)用程序增添了不少魅力,當(dāng)前有超過百支谷歌團隊在使用這項技術(shù),包括街景、收件箱智能回復(fù)、語音搜索等。在I/O 2016大會的主題演講期間,Google向大家介紹了其在人工智能和機器學(xué)習(xí)領(lǐng)域的最新進展,其中一個有趣的細(xì)節(jié),就是所謂的TPU(張量處理單元)定制芯片。為了幫助大家更好地理解,Google著名硬件工程師Norm Jouppi特地在云平臺博客上發(fā)表了一篇深入介紹TPU的文章。
一塊TPU的板子,剛好可以插入數(shù)據(jù)中心機架的一個驅(qū)動器位。
優(yōu)秀的軟件,自然少不了優(yōu)秀硬件的加持。幾年前,Google就已經(jīng)悄悄地開展了一個項目——自己動手,為機器學(xué)習(xí)應(yīng)用程序提供定制加速。
這項研究的成果,就是本文要著重介紹的“張量處理單元”(Tensor Processing Unit),簡稱TPU。這是一款為機器學(xué)習(xí)而定制的ASIC、并且經(jīng)過了TensorFlow的調(diào)教。
TPU已經(jīng)在Google數(shù)據(jù)中心運行了一年多,實踐表明它可以為機器學(xué)習(xí)帶來相當(dāng)出色的每瓦特性能表現(xiàn)。TPU是專為機器學(xué)習(xí)應(yīng)用而定制的,它的寬容度更高,可以降低計算的精度(所需的晶體管操作也更少)。
正因如此,我們每秒都可以在芯片中擠出更多的操作時間,使用更復(fù)雜和強大的機器學(xué)習(xí)模型、將之更快的部署,用戶也會更加迅速地獲得更智能的結(jié)果。
TPU在AlphaGo與李世石的“世紀(jì)之戰(zhàn)”中得到了實際應(yīng)用。
TPU是Google從研究快速走向?qū)嶋H應(yīng)用的一個積極例子,團隊只花了22天的時間,就讓它在數(shù)據(jù)中心運行了起來。
TPU早已為許多Google服務(wù)提供支撐,包括RankBrain(用于改進搜索結(jié)果的相關(guān)性)和街景(改進地圖導(dǎo)航的精度和品質(zhì))。
在與李世石的人機圍棋對戰(zhàn)中,AlphaGo的背后也有著TPU的身影。TPU讓AlphaGo可以更快的思考,在移動之前更加高瞻遠(yuǎn)矚。
Google的目標(biāo)是在機器學(xué)習(xí)領(lǐng)域做到業(yè)內(nèi)領(lǐng)先,同時將創(chuàng)新提供給盡可能多的客戶。
在基礎(chǔ)設(shè)施對戰(zhàn)中打造的TPU,使得Google能夠向開發(fā)者們帶去更大的軟件能量,比如在先進的加速技術(shù)加持下的TensorFlow和云機器學(xué)習(xí)。
機器學(xué)習(xí)已經(jīng)改變了開發(fā)者們?yōu)橄M者打造智能應(yīng)用程序的方法,我們熱切期待著它能夠走入我們的日常生活中。