人工智能和機器學習與深度學習之間是怎樣的關系
人工智能?機器學習?深度學習?安全界用辭令人困惑,了解主要用語真正的意義,方可在信息安全的世界中游走自如。
在熱情的市場營銷人員口中,“人工智能”、“機器學習” 和 “深度學習” 的定義變得模糊,明確性讓位于增加銷量的需要??蛻敉耆锌赡苡龅劫N著多個此類標簽,卻幾乎不具備這些特性的產(chǎn)品或服務。
機器智能的話題常會落入其獨特的術(shù)語和專業(yè)概念無底洞。這些術(shù)語將構(gòu)成未來安全基礎設施中的重要部分,其間區(qū)別真的重要嗎?
三個分支
總的說來,機器 “智能” 就是一套系統(tǒng),攝入數(shù)據(jù),產(chǎn)出結(jié)果,并且隨著數(shù)據(jù)攝入量的增加而不斷變得更好、更快。整個機器 “智能” 大類下有三個標簽常被貼到系統(tǒng)上:機器學習、深度學習和人工智能。每一種都有其獨有的數(shù)據(jù)處理方式和結(jié)果呈現(xiàn)方式。
這三種方式在運行機制上的差異使得它們分別適用于不同的任務。而其間最為突出的差別存在于人工智能 (AI) 和其他兩種之間。簡單講,AI 的結(jié)果能令你震驚,而其他兩種則“只”能讓你驚異于其速度和準確性。
機器學習
機器學習采用靜態(tài)模型(營銷人員口中的 “啟發(fā)式方法”)而非僵化的算法編程來獲得結(jié)果。從稍微不同的角度觀察,機器學習可以運用大量輸入來獲得特定的結(jié)果集。
市面上很多技術(shù)都可以歸到機器學習上來。比如監(jiān)督和非監(jiān)督式學習、異常檢測,以及關聯(lián)規(guī)則。以上幾種技術(shù)中,機器學習都可以從中輸入新的學習樣本,讓其作為動作依據(jù)的算法模型更加豐富、全面、準確。
所以,關鍵就在于 “特定結(jié)果集”。比如說,如果你想讓機器學習系統(tǒng)分辨貓和狗,你可以教它各種用于定義貓和狗的參數(shù)。越多數(shù)據(jù)用于構(gòu)建模型,該系統(tǒng)就越能準確區(qū)分貓和狗,最終能夠基于耳朵或尾巴分辨目標對象是貓還是狗。但即使你拿出的是一只鵝,該系統(tǒng)也會告訴你是一條狗還是一只貓,因為判斷結(jié)果就只有這兩種選擇。
如果目標是分類多種輸入,或者指示要采取的特定動作以完成自動化過程,那么機器學習就是非常合適的一種技術(shù)。
深度學習
深度學習歸屬機器學習范疇,但是其中尤為特別的一類?!吧疃葘W習” 表明神經(jīng)網(wǎng)絡屬于處理技術(shù)大家族。盡管神經(jīng)網(wǎng)絡面世已久,但最近十年的發(fā)展才令該技術(shù)更貼近應用開發(fā)人員。
如今的神經(jīng)網(wǎng)絡基本上采用層次化技術(shù)在多個處理層間傳遞輸入。這是神經(jīng)網(wǎng)絡模擬動物智能的一種方式。這種擬態(tài)使深度學習適用于為數(shù)不少的一系列應用。
安全之外的語音識別和圖像識別應用就常建立在深度學習技術(shù)之上。而在安全領域,深度學習常見于惡意軟件檢測和威脅檢測系統(tǒng)。因為神經(jīng)網(wǎng)絡節(jié)點間的連接數(shù)量(從幾百個到數(shù)百萬個不等),學習和處理主要發(fā)生在中央云系統(tǒng),而學習結(jié)果應用在網(wǎng)絡邊界的那類應用,常會用到深度學習技術(shù)。
沿用前文中舉的貓狗分辨例子,深度學習也能夠?qū)W習如何分辨貓和狗,經(jīng)訓練后能判斷狗和貓的品系,甚至能達到根據(jù)外貌特征給雜種狗指派可能品系的程度。但,深度學習仍然只局限在分辨貓狗上,可憐的大鵝依然不存在于深度學習的結(jié)果集中。
人工智能
機器學習和深度學習系統(tǒng)都是不斷攝入大量數(shù)據(jù),返回特定參數(shù)集范圍內(nèi)的結(jié)果。所以,這兩種技術(shù)便于集成到自動化系統(tǒng)中。人工智能則不然,其得出的結(jié)論可能超出定義的參數(shù)。人工智能拿出的結(jié)果會令你驚訝。
若咨詢學術(shù)界 AI 研究員,他們會說市面上的 AI 都不“真” AI。他們的意思其實是當前不存在通用 AI ——《太空漫游 2001》里 HAL 9000 那種人工智能電腦。
但是,可針對特定問題應用先進智能的 AI 系統(tǒng)是存在的。IBM 的 Watson 就是其中最為知名的,但還有其他很多特定于應用的 AI 引擎為各供應商所用?!吧疃葌卧臁?(deep fake) 音視頻引發(fā)的廣泛擔憂,也是不同應用和服務中所用 AI 功能催生的。機器人,包括自動駕駛汽車,則是另一個例子。
AI 系統(tǒng)應能納入深度學習中建立的所有模型信息并加以延伸。再給多一點信息,AI 系統(tǒng)還可能分辨新圖像是哺乳動物還是其他種類的動物,即便呈現(xiàn)在眼前的是消防栓的圖片,AI 系統(tǒng)也能告訴人類操作員這是從未見過的新 “動物”,需要更多學習。AI 的結(jié)果可能跳出給定的結(jié)果集。
網(wǎng)絡安全領域里,分析師用 AI 幫助篩選和分類每天涌入安全運營中心 (SOC) 的大量輸入數(shù)據(jù)。需要指出的是,現(xiàn)今非預期結(jié)果出現(xiàn)的可能性意味著,AI 是用來輔助或增強人類分析師的,不僅僅用于驅(qū)動安全自動化。
天網(wǎng)預備役
面對以上幾種機器智能,操作人員必須警惕兩大問題,其中一個問題由內(nèi)部力量驅(qū)動,另一個問題則受外因推動。內(nèi)部問題是所謂的 “模型偏好”——系統(tǒng)模型中用于學習的數(shù)據(jù)會使模型偏向特定分析方向,而不是由系統(tǒng)自然得出數(shù)理上正確的答案。
外部問題則源自 “模型中毒”,也就是有外部因素確保模型得出不正確的結(jié)果。取決于應用,中毒可導致令人尷尬或災難性的結(jié)果,IT 或安全人員必須警惕這種可能性。
來源:安全牛