當(dāng)前位置：首頁(yè) > 智能硬件 > 人工智能AI

機(jī)器學(xué)習(xí)存在哪些潛力與陷阱

時(shí)間：2020-05-31 20:27:01

關(guān)鍵字：人工智能機(jī)器學(xué)習(xí)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 最近這段時(shí)間，機(jī)器學(xué)習(xí)吸引了媒體和從業(yè)者大量的關(guān)注。的確，機(jī)器學(xué)習(xí)是一種變革性的技術(shù)。但是，盡管眾人對(duì)這個(gè)話(huà)題喋喋不休，盡管風(fēng)投為機(jī)器學(xué)習(xí)提供了許多資金，盡管谷歌讓這個(gè)領(lǐng)域變得令人矚目——在核心

最近這段時(shí)間，機(jī)器學(xué)習(xí)吸引了媒體和從業(yè)者大量的關(guān)注。的確，機(jī)器學(xué)習(xí)是一種變革性的技術(shù)。但是，盡管眾人對(duì)這個(gè)話(huà)題喋喋不休，盡管風(fēng)投為機(jī)器學(xué)習(xí)提供了許多資金，盡管谷歌讓這個(gè)領(lǐng)域變得令人矚目——在核心的技術(shù)領(lǐng)袖圈之外，機(jī)器學(xué)習(xí)仍然很少能獲得正確的理解。

這就導(dǎo)致了對(duì)于機(jī)器學(xué)習(xí)這一變革性技術(shù)的未來(lái)的低估，而從商者也會(huì)因此無(wú)緣于了解他們應(yīng)該為機(jī)器學(xué)習(xí)時(shí)代做好怎樣的準(zhǔn)備。

讓我們討論一下這把劍的兩面吧——也就是它的潛力與陷阱。先從定義開(kāi)始。

機(jī)器學(xué)習(xí)是一種算法，可以從數(shù)據(jù)中進(jìn)行學(xué)習(xí)并作出預(yù)測(cè)。通常來(lái)說(shuō)，運(yùn)用這種技術(shù)時(shí)，越多的數(shù)據(jù)就能帶來(lái)越好的結(jié)果。機(jī)器學(xué)習(xí)并不需要明確的規(guī)則來(lái)生成結(jié)果。它不需要人工建構(gòu)的“如果這樣的話(huà)，那么就那樣”之類(lèi)的結(jié)構(gòu)，而是根據(jù)數(shù)據(jù)自行決定這一切。

機(jī)器學(xué)習(xí)的變革性作用，以及為何它現(xiàn)在如此重要，是因?yàn)槲覀儊?lái)到了數(shù)據(jù)、運(yùn)算能力以及算法復(fù)雜度的轉(zhuǎn)折點(diǎn)。

這三個(gè)方面的進(jìn)展匯合，造就了機(jī)器學(xué)習(xí)的一鳴驚人。這似乎有一些像妄想——為了能夠在現(xiàn)在發(fā)生這樣的事，在過(guò)去已經(jīng)籌備了相當(dāng)長(zhǎng)的時(shí)間。讓我們仔細(xì)看看這三個(gè)方面：

數(shù)據(jù)

新數(shù)據(jù)庫(kù)技術(shù)的出現(xiàn)（比如Hadoop）已經(jīng)讓獲取海量數(shù)據(jù)的成本降低到令人吃驚的程度，以至于企業(yè)不再需要選擇什么數(shù)據(jù)需要保留、什么數(shù)據(jù)需要?jiǎng)h除，而是簡(jiǎn)單地存儲(chǔ)一切數(shù)據(jù)。如果數(shù)據(jù)的價(jià)值在今天還不太明顯，不久之后也許人們就會(huì)漸漸地意識(shí)到這一點(diǎn)。這為對(duì)于數(shù)據(jù)始終貪得無(wú)厭的機(jī)器學(xué)習(xí)算法提供了大量的“養(yǎng)分”。

運(yùn)算能力

運(yùn)算能力方面的進(jìn)展仍然在以讓人驚訝的速度持續(xù)著。摩爾定律失效的預(yù)言已經(jīng)過(guò)去了許多年，而Intel、IBM、Nvidia以及其他機(jī)構(gòu)的研究人員們接二連三地不斷創(chuàng)新，讓摩爾定律一直保持成立、沒(méi)有失效。要解決大問(wèn)題？沒(méi)問(wèn)題，加上幾十或者幾百個(gè)核，根據(jù)需求來(lái)就好。不過(guò)，這也有極限，因?yàn)椴皇撬袉?wèn)題都能被這樣暴力破解。

算法復(fù)雜度

有趣的是，算法復(fù)雜度是與數(shù)據(jù)和運(yùn)算相關(guān)的。由于這兩個(gè)領(lǐng)域的進(jìn)展，更徹底地探索復(fù)雜算法成為了可能。例如拓?fù)鋽?shù)據(jù)分析——它需要運(yùn)算能力發(fā)展到能夠從許多運(yùn)算角（algorithmic angles）來(lái)看待大量數(shù)據(jù)集。

機(jī)器學(xué)習(xí)的變革性在于，它大幅地降低了高性能結(jié)果的運(yùn)算時(shí)間。研究人員們已經(jīng)在圖像識(shí)別問(wèn)題上花費(fèi)了數(shù)十年的時(shí)間，但Google轉(zhuǎn)向機(jī)器學(xué)習(xí)算法后僅僅幾個(gè)季度就高效地在這個(gè)問(wèn)題上做到了完美的表現(xiàn)?？紤]到Google擁有的素材數(shù)量和團(tuán)隊(duì)的熟練程度，幾乎沒(méi)有人有可能在這個(gè)領(lǐng)域再勝過(guò)Google。

這一類(lèi)的創(chuàng)新在不少企業(yè)都發(fā)生著，特別是那些雇傭了絕大多數(shù)機(jī)器學(xué)習(xí)人才的公司，包括Google、Facebook、Amazon、Apple、IBM、GE，以及高度專(zhuān)注于顛覆特定應(yīng)用或是行業(yè)的一些初創(chuàng)公司。

這些公司在機(jī)器學(xué)習(xí)方面投資甚巨，這是因?yàn)橥顿Y能帶來(lái)指數(shù)級(jí)的增長(zhǎng)回報(bào)。在一個(gè)機(jī)器學(xué)習(xí)帶來(lái)的指數(shù)級(jí)增長(zhǎng)的世界中，即使只是少了10%的增長(zhǎng)也會(huì)導(dǎo)致落于人后。而太晚開(kāi)始的話(huà)，就算能和其他人保持一樣的增長(zhǎng)速度也無(wú)濟(jì)于事。

雖然卓越的執(zhí)行會(huì)獲得指數(shù)級(jí)增長(zhǎng)的回報(bào)，現(xiàn)實(shí)中將會(huì)有一系列不連續(xù)的事件，讓增長(zhǎng)曲線(xiàn)無(wú)法保持平滑。一家企業(yè)如何處理這些不連續(xù)的事件將會(huì)決定成王敗寇。

這些不連續(xù)的事件就是機(jī)器學(xué)習(xí)的另一面——那些會(huì)導(dǎo)致這種技術(shù)充滿(mǎn)競(jìng)爭(zhēng)力的優(yōu)勢(shì)滑鐵盧的元素。

這里列舉了一些：

技術(shù)債

機(jī)器學(xué)習(xí)系統(tǒng)并不是能自我復(fù)制（self-replicating）或者自我優(yōu)化（self-opTImizing）的軟件應(yīng)用。因此，隨著時(shí)間流逝，它們會(huì)積累越來(lái)越多的技術(shù)債。技術(shù)債有許多種表現(xiàn)形式，包括糾纏（entanglement）、隱藏反饋循環(huán)（hidden feedback loops）、依賴(lài)于未充分使用的數(shù)據(jù)（underuTIlized data dependencies）、管道叢林（pipeline jungles）、未申明的訪問(wèn)者（undeclared customers）等等。技術(shù)債會(huì)在無(wú)意中導(dǎo)致不希望的結(jié)果，帶來(lái)脆弱（brittleness）以及混淆（obfuscaTIon）。所有這一切都會(huì)對(duì)系統(tǒng)產(chǎn)生影響，讓系統(tǒng)無(wú)法達(dá)到最優(yōu)狀態(tài)。

理解技術(shù)債的細(xì)節(jié)是技術(shù)團(tuán)隊(duì)的責(zé)任。

理解技術(shù)債的概念和影響是管理團(tuán)隊(duì)的責(zé)任。

關(guān)于機(jī)器學(xué)習(xí)技術(shù)債的細(xì)節(jié)，請(qǐng)?jiān)谛轮窃⑿殴娞?hào)后臺(tái)回復(fù)xxxx，閱讀新智元翻譯的、來(lái)自谷歌的技術(shù)債詳細(xì)介紹：【Google 年度頂級(jí)論文】機(jī)器學(xué)習(xí)系統(tǒng)，隱藏多少技術(shù)債？（論文下載）。

黑盒

某些算法是黑盒——這是指難以理解在算法中發(fā)生了什么，特別是對(duì)于單獨(dú)的數(shù)據(jù)點(diǎn)來(lái)說(shuō)。這并不總是會(huì)成為一個(gè)問(wèn)題，但是，它對(duì)于一個(gè)組織而言很多時(shí)候都代表了真實(shí)存在的挑戰(zhàn)，無(wú)論是從文化上還是從技術(shù)上來(lái)說(shuō)都是這樣。如果選用的算法是一個(gè)黑盒，而世界的變化超出了模型的預(yù)測(cè)能力，那么缺乏足夠的理解會(huì)讓整個(gè)系統(tǒng)陷入懷疑論的危機(jī)。無(wú)法解釋模型為何失敗，從接收機(jī)器學(xué)習(xí)算法程度的角度來(lái)說(shuō)，可以讓一個(gè)組織在這一方面倒退許多年。

算法選擇

雖然這有一些老生常談，不過(guò)在機(jī)器學(xué)習(xí)領(lǐng)域的確沒(méi)有“上帝”一樣萬(wàn)能的算法。沒(méi)有算法能在文本分析、模式匹配、分詞、異常偵測(cè)、以及特征生成上都做得一樣好。

的確，有幾十種強(qiáng)力的算法和數(shù)千種這些算法的高度調(diào)整（highly tuned）版本，每一種都有它自己獨(dú)有的優(yōu)點(diǎn)和缺點(diǎn)。最終，不同的算法會(huì)服務(wù)于不同的目的。比如，你的邏輯回歸模型（LRM）看待數(shù)據(jù)世界的方式與你的支持向量機(jī)（SVM）有很大的差異。這意味著，作為一個(gè)數(shù)據(jù)科學(xué)家或者是一個(gè)計(jì)算機(jī)科學(xué)家，你有時(shí)會(huì)放下LRM、轉(zhuǎn)而用起SVM——它們是為不同的工作而服務(wù)的。但是它們之前的區(qū)別并不只是類(lèi)似于不同尺寸的扳手，并且放下LRM、轉(zhuǎn)向SVM在上手時(shí)是非常消耗時(shí)間的。

選用正確的算法對(duì)于保持一個(gè)組織的良好運(yùn)作來(lái)說(shuō)是非常重要的，就和了解使用什么時(shí)候應(yīng)該使用凈現(xiàn)值（NPV）、什么時(shí)候應(yīng)該使用內(nèi)部收益率（IRR）一樣。

人類(lèi)的偏差

與算法選擇相關(guān)的一個(gè)概念是人類(lèi)偏差（human bias）。無(wú)論如何，機(jī)器學(xué)習(xí)算法都是復(fù)雜的數(shù)學(xué)公式，而精通某種特定的算法會(huì)讓從業(yè)者對(duì)這種算法產(chǎn)生依賴(lài)——通常是嚴(yán)重的依賴(lài)。這種趨勢(shì)讓人想起一句古老的諺語(yǔ)，“當(dāng)你除了錘子一無(wú)所有時(shí)，所有東西看上去都像釘子”。如果你的機(jī)器學(xué)習(xí)團(tuán)隊(duì)中，所有人都畢業(yè)于同一個(gè)學(xué)校的同一期，有可能他們用的都是同樣的一些算法。向你的組織中注入算法多樣性會(huì)為組織帶來(lái)明顯的益處。

避免陷阱

因?yàn)榧夹g(shù)債的存在，領(lǐng)導(dǎo)層需要確保厲害的軟件工程師與厲害的數(shù)學(xué)家同在。缺少其中一方將會(huì)失去平衡，在未來(lái)導(dǎo)致很多問(wèn)題。招募雙方。

對(duì)于黑盒問(wèn)題，你需要仰賴(lài)數(shù)百年來(lái)的統(tǒng)計(jì)學(xué)知識(shí)來(lái)解釋模型中每一個(gè)決策背后的原因。這種要求非常嚴(yán)苛，但當(dāng)你需要知道為什么算法最后做出了一個(gè)決策時(shí)，經(jīng)歷這樣的時(shí)間是非常重要的。這對(duì)于創(chuàng)造一種機(jī)器學(xué)習(xí)文化而言至關(guān)重要。人們需要信任這個(gè)系統(tǒng)，而統(tǒng)計(jì)學(xué)可以提供溝通人類(lèi)與算法的橋梁。

面對(duì)算法選擇的挑戰(zhàn)，答案是部署越來(lái)越多種類(lèi)的算法，于是你不必再?gòu)闹羞x擇。計(jì)算機(jī)的性能已經(jīng)足夠做到這一點(diǎn)，已經(jīng)有可以對(duì)于數(shù)據(jù)集用多種算法并行處理的框架。好好利用。

最后，如果你部署了多種機(jī)器學(xué)習(xí)算法，人類(lèi)偏差問(wèn)題應(yīng)當(dāng)迎刃而解——特別是如果你采用了讓過(guò)程自動(dòng)化的技術(shù)，用數(shù)據(jù)來(lái)自動(dòng)找出最適應(yīng)的算法。

前方的機(jī)遇

機(jī)器學(xué)習(xí)將無(wú)愧于它得到的炒作。明白情況的人都會(huì)對(duì)它的變革性——對(duì)于任何職業(yè)、工作流程和商務(wù)處理來(lái)說(shuō)都是這樣——保持高度的信心。

率先邁向機(jī)器學(xué)習(xí)的組織將會(huì)獲得相應(yīng)的回報(bào)。但是理解機(jī)器學(xué)習(xí)的潛力和風(fēng)險(xiǎn)是非常重要的，因?yàn)閷?duì)于機(jī)器學(xué)習(xí)領(lǐng)域的熟悉程度仍然不足?，F(xiàn)在正是時(shí)候針對(duì)這一技術(shù)深挖、學(xué)習(xí)、雇傭、以及投資，等到明天的話(huà)，也許你的競(jìng)爭(zhēng)對(duì)手就已經(jīng)開(kāi)始來(lái)勢(shì)洶洶地?cái)U(kuò)張了。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國(guó)博世”

9月2日消息，不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變?cè)撇捎煤凸芾矸绞?/a>

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車(chē)市場(chǎng)，使汽車(chē)開(kāi)發(fā)時(shí)間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字：汽車(chē) 人工智能智能驅(qū)動(dòng) BSP

[美通社全球TMT]

從容應(yīng)對(duì)未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn)，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國(guó)游戲市場(chǎng)開(kāi)始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報(bào)道，騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴(lài)西方的技術(shù)

8月28日消息，今天上午，2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話(huà)語(yǔ)權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng)，數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國(guó)通信服務(wù)公布2024年中期業(yè)績(jī)

要點(diǎn)：有效應(yīng)對(duì)環(huán)境變化，經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競(jìng)爭(zhēng)力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字：通信 BSP 電信運(yùn)營(yíng)商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動(dòng)力與長(zhǎng)三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上，軟通動(dòng)力信息技術(shù)（集團(tuán)）股份有限公司（以下簡(jiǎn)稱(chēng)"軟通動(dòng)力"）與長(zhǎng)三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)