首個(gè)神經(jīng)網(wǎng)絡(luò)工控系統(tǒng)的應(yīng)用在谷歌上線了
掃描二維碼
隨時(shí)隨地手機(jī)看文章
即便深度學(xué)習(xí)和其它機(jī)器學(xué)習(xí)方法近幾年已經(jīng)取得了不小的發(fā)展,但是把它們直接應(yīng)用在真實(shí)工業(yè)場景中、讓它們直接控制工業(yè)系統(tǒng)還未曾見到。深度學(xué)習(xí)本身缺乏魯棒性、面對新狀況難以預(yù)測行為等一些特性固然是重要的掣肘之處,如何讓算法逐步提高控制范圍、協(xié)調(diào)與人類的協(xié)作方式也是難題。DeepMind 和谷歌最近就做出了新一步嘗試,取得了不小的成功,然后在 DeepMind 博客上進(jìn)行了介紹。雷鋒網(wǎng) AI 科技評論編譯如下。
我們?nèi)祟惿鐣鎸Φ脑S多緊迫問題中,有許多問題還在變得越來越復(fù)雜,所有人都急切地想要找到好的解決方法。對于 DeepMind 和谷歌來說,他們相信如果人類可以把 AI 作為探尋新知識的工具加以利用,找到解決方法就會容易得多。
最近,DeepMind 把這個(gè)系統(tǒng)升級到了一個(gè)全新的級別上:不再像原來的系統(tǒng)那樣向人類推薦一些動作,然后由人類去完成,AI 系統(tǒng)現(xiàn)在會直接控制數(shù)據(jù)中心的冷卻系統(tǒng),當(dāng)然了它也仍然受到數(shù)據(jù)中心運(yùn)營人員的專業(yè)監(jiān)控。這是首個(gè)基于云的控制系統(tǒng),已經(jīng)在多個(gè)谷歌的數(shù)據(jù)中心中安靜地運(yùn)行、持續(xù)地節(jié)省能源。
每隔 5 分鐘,這個(gè)基于云的 AI 會從數(shù)據(jù)中心的數(shù)千個(gè)傳感器中采集數(shù)據(jù),獲得數(shù)據(jù)中心冷卻系統(tǒng)的狀態(tài)快照,然后把它輸入深度神經(jīng)網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)會預(yù)測各種可能的操作的不同組合會如何影響數(shù)據(jù)中心的能量消耗。然后 AI 就會就會在滿足魯棒安全性限制的條件下判斷出一組能夠最小化能源消耗的動作。這些動作的判斷結(jié)果接下來會被發(fā)回給數(shù)據(jù)中心,由本地的控制系統(tǒng)驗(yàn)證并執(zhí)行。
這種系統(tǒng)運(yùn)行的想法其實(shí)來自于在數(shù)據(jù)中心使用原來那個(gè) AI 推薦系統(tǒng)的操作人員。他們告訴 DeepMind 的研究人員們,雖然系統(tǒng)給他們教了一些最新最好的操作技巧,比如讓冷卻介質(zhì)覆蓋更多的設(shè)備,而不是更少,但是實(shí)現(xiàn)這些推薦操作其實(shí)需要花費(fèi)非常多的操作精力和長期規(guī)劃。所以他們自然地就很想知道,能不能不需要人來出力就達(dá)到類似的能源節(jié)省效果。
谷歌的數(shù)據(jù)中心里一般都有上千臺服務(wù)器,它們支撐著谷歌搜索、Gmail、YouTube 等用戶們每天都會使用的服務(wù)。確保這些服務(wù)可以可靠、高效地運(yùn)行是最關(guān)鍵的一件事。DeepMind 和谷歌一起設(shè)計(jì) AI 智能體以及背后的控制界面時(shí),都是帶著安全、可靠的思維從頭設(shè)計(jì)的,還使用了 8 種不同的機(jī)制確保系統(tǒng)能夠總是能夠按照預(yù)期行動。
他們使用的方法里,其中一種較為簡單的是估計(jì)不確定性。對于總計(jì)上億個(gè)可能的動作中的每一種,AI 智能體都需要計(jì)算自己認(rèn)為這是一個(gè)好的動作的信心。估計(jì)出來信心太低的動作就不去考慮了。
另一個(gè)方法是兩層驗(yàn)證。AI 計(jì)算出的最優(yōu)行動首先需要根據(jù)一個(gè)內(nèi)置的、由數(shù)據(jù)中心運(yùn)營人員們制定的安全限制清單做檢查。計(jì)算的結(jié)果通過檢查、從云端發(fā)送到實(shí)際的數(shù)據(jù)中心之后,當(dāng)?shù)氐目刂葡到y(tǒng)還會再次把指令根據(jù)自己的一套安全限制清單再檢查一遍。這種冗余設(shè)計(jì)的檢查流程確保了系統(tǒng)的運(yùn)行總是在當(dāng)?shù)氐南拗浦畠?nèi)的,操作人員們也總是對操作的邊界有完全的控制。
最重要的是,谷歌的數(shù)據(jù)中心總是會受到人類的完全控制的,人類隨時(shí)可以選擇退出 AI 控制模式。這時(shí)候,控制系統(tǒng)會自動從 AI 控制無縫地切換到基于現(xiàn)代自動化工業(yè)使用的基于現(xiàn)場規(guī)則的以及啟發(fā)式設(shè)計(jì)的控制系統(tǒng)。連續(xù)監(jiān)控、自動錯(cuò)誤重啟、平滑切換、兩層驗(yàn)證、不間斷通訊、不確定性估計(jì)、規(guī)則與啟發(fā)式設(shè)計(jì)的備用控制系統(tǒng)、人類指令優(yōu)先
相比于原來的動作推薦系統(tǒng)需要操作人員自己檢查以及實(shí)施推薦的動作,新的 AI 控制系統(tǒng)是自己直接實(shí)現(xiàn)這些動作的。DeepMind 和谷歌的研究人員在開發(fā)它時(shí)也有有意識地把系統(tǒng)的優(yōu)化邊界設(shè)定到了一個(gè)更窄更小的策略中,讓它把安全和可靠作為首要目標(biāo),也就是說對于節(jié)約能源的目標(biāo)來說,它需要在過于節(jié)約導(dǎo)致的不穩(wěn)定風(fēng)險(xiǎn)和優(yōu)化不足的低反饋之間找到平衡。
雖然只上線了幾個(gè)月時(shí)間,這個(gè)系統(tǒng)已經(jīng)可以穩(wěn)定地節(jié)約平均 30% 左右的能源,而且他們還期待系統(tǒng)未來可以改善更多。這是因?yàn)殡S著數(shù)據(jù)更多,系統(tǒng)的優(yōu)化判斷能力也會變得更強(qiáng),如下圖。隨著技術(shù)越來越成熟,DeepMind 和谷歌的研究人員未來也會把系統(tǒng)的優(yōu)化邊界設(shè)置得寬松一些,來達(dá)到更好的能源節(jié)約效果。
這個(gè) AI 直接控制的系統(tǒng)時(shí)不時(shí)找到一些新的方法管理冷卻系統(tǒng),有一些方法甚至讓數(shù)據(jù)庫操作人員覺得驚訝。與這個(gè)系統(tǒng)緊密協(xié)作的一位谷歌數(shù)據(jù)中心運(yùn)營人員就驚訝道:「這個(gè) AI 會利用冬天外面比較冷的特點(diǎn),產(chǎn)生比平時(shí)更冷的冷卻水,然后減少了給數(shù)據(jù)中心降溫所需的能源消耗。規(guī)則是不會自己變得越來越好的,但是 AI 可以啊。」
對于已經(jīng)安全運(yùn)行、獨(dú)立運(yùn)行、降低能耗的 AI 直接控制系統(tǒng),DeepMind 和谷歌都覺得非常激動。不過,在數(shù)據(jù)中心中使用這樣的系統(tǒng)才僅僅是個(gè)開始。在長遠(yuǎn)的未來,他們認(rèn)為還有很多的潛力把這樣的技術(shù)運(yùn)用在其他工業(yè)場景中,也就可以在更大的規(guī)模上幫助對抗氣候變化。