當(dāng)前位置：首頁 > 智能硬件 > 人工智能AI

想成為深度學(xué)習(xí)的高手必須要懂哪些知識？

時間：2020-08-04 07:39:01

關(guān)鍵字：機(jī)器學(xué)習(xí) 深度學(xué)習(xí)

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] 深度學(xué)習(xí)本質(zhì)上是深層的人工神經(jīng)網(wǎng)絡(luò)，它不是一項(xiàng)孤立的技術(shù)，而是數(shù)學(xué)、統(tǒng)計(jì)機(jī)器學(xué)習(xí)、計(jì)算機(jī)科學(xué)和人工神經(jīng)網(wǎng)絡(luò)等多個領(lǐng)域的綜合。深度學(xué)習(xí)的理解，離不開本科數(shù)學(xué)中最為基礎(chǔ)的數(shù)學(xué)分析（高等數(shù)學(xué)）、線性代

深度學(xué)習(xí)本質(zhì)上是深層的人工神經(jīng)網(wǎng)絡(luò)，它不是一項(xiàng)孤立的技術(shù)，而是數(shù)學(xué)、統(tǒng)計(jì)機(jī)器學(xué)習(xí)、計(jì)算機(jī)科學(xué)和人工神經(jīng)網(wǎng)絡(luò)等多個領(lǐng)域的綜合。深度學(xué)習(xí)的理解，離不開本科數(shù)學(xué)中最為基礎(chǔ)的數(shù)學(xué)分析（高等數(shù)學(xué)）、線性代數(shù)、概率論和凸優(yōu)化；深度學(xué)習(xí)技術(shù)的掌握，更離不開以編程為核心的動手實(shí)踐。沒有扎實(shí)的數(shù)學(xué)和計(jì)算機(jī)基礎(chǔ)做支撐，深度學(xué)習(xí)的技術(shù)突破只能是空中樓閣。

所以，想在深度學(xué)習(xí)技術(shù)上有所成就的初學(xué)者，就有必要了解這些基礎(chǔ)知識之于深度學(xué)習(xí)的意義。除此之外，我們的專業(yè)路徑還會從結(jié)構(gòu)與優(yōu)化的理論維度來介紹深度學(xué)習(xí)的上手，并基于深度學(xué)習(xí)框架的實(shí)踐淺析一下進(jìn)階路徑。

最后，本文還將分享深度學(xué)習(xí)的實(shí)踐經(jīng)驗(yàn)和獲取深度學(xué)習(xí)前沿信息的經(jīng)驗(yàn)。

數(shù)學(xué)基礎(chǔ)

如果你能夠順暢地讀懂深度學(xué)習(xí)論文中的數(shù)學(xué)公式，可以獨(dú)立地推導(dǎo)新方法，則表明你已經(jīng)具備了必要的數(shù)學(xué)基礎(chǔ)。

掌握數(shù)學(xué)分析、線性代數(shù)、概率論和凸優(yōu)化四門數(shù)學(xué)課程包含的數(shù)學(xué)知識，熟知機(jī)器學(xué)習(xí)的基本理論和方法，是入門深度學(xué)習(xí)技術(shù)的前提。因?yàn)闊o論是理解深度網(wǎng)絡(luò)中各個層的運(yùn)算和梯度推導(dǎo)，還是進(jìn)行問題的形式化或是推導(dǎo)損失函數(shù)，都離不開扎實(shí)的數(shù)學(xué)與機(jī)器學(xué)習(xí)基礎(chǔ)。

數(shù)學(xué)分析

在工科專業(yè)所開設(shè)的高等數(shù)學(xué)課程中，主要學(xué)習(xí)的內(nèi)容為微積分。對于一般的深度學(xué)習(xí)研究和應(yīng)用來說，需要重點(diǎn)溫習(xí)函數(shù)與極限、導(dǎo)數(shù)（特別是復(fù)合函數(shù)求導(dǎo)）、微分、積分、冪級數(shù)展開、微分方程等基礎(chǔ)知識。在深度學(xué)習(xí)的優(yōu)化過程中，求解函數(shù)的一階導(dǎo)數(shù)是最為基礎(chǔ)的工作。當(dāng)提到微分中值定理、Taylor公式和拉格朗日乘子的時候，你不應(yīng)該只是感到與它們似曾相識。這里推薦同濟(jì)大學(xué)第五版的《高等數(shù)學(xué)》教材。

線性代數(shù)

深度學(xué)習(xí)中的運(yùn)算常常被表示成向量和矩陣運(yùn)算。線性代數(shù)正是這樣一門以向量和矩陣作為研究對象的數(shù)學(xué)分支。需要重點(diǎn)溫習(xí)的包括向量、線性空間、線性方程組、矩陣、矩陣運(yùn)算及其性質(zhì)、向量微積分。當(dāng)提到Jacobian矩陣和Hessian矩陣的時候，你需要知道確切的數(shù)學(xué)形式；當(dāng)給出一個矩陣形式的損失函數(shù)時，你可以很輕松的求解梯度。這里推薦同濟(jì)大學(xué)第六版的《線性代數(shù)》教材。

概率論

概率論是研究隨機(jī)現(xiàn)象數(shù)量規(guī)律的數(shù)學(xué)分支，隨機(jī)變量在深度學(xué)習(xí)中有很多應(yīng)用，無論是隨機(jī)梯度下降、參數(shù)初始化方法（如Xavier），還是Dropout正則化算法，都離不開概率論的理論支撐。除了掌握隨機(jī)現(xiàn)象的基本概念（如隨機(jī)試驗(yàn)、樣本空間、概率、條件概率等）、隨機(jī)變量及其分布之外，還需要對大數(shù)定律及中心極限定理、參數(shù)估計(jì)、假設(shè)檢驗(yàn)等內(nèi)容有所了解，進(jìn)一步還可以深入學(xué)習(xí)一點(diǎn)隨機(jī)過程、馬爾可夫隨機(jī)鏈的內(nèi)容。這里推薦浙江大學(xué)版的《概率論與數(shù)理統(tǒng)計(jì)》。

凸優(yōu)化

結(jié)合以上三門基礎(chǔ)的數(shù)學(xué)課程，凸優(yōu)化可以說是一門應(yīng)用課程。但對于深度學(xué)習(xí)而言，由于常用的深度學(xué)習(xí)優(yōu)化方法往往只利用了一階的梯度信息進(jìn)行隨機(jī)梯度下降，因而從業(yè)者事實(shí)上并不需要多少“高深”的凸優(yōu)化知識。理解凸集、凸函數(shù)、凸優(yōu)化的基本概念，掌握對偶問題的一般概念，掌握常見的無約束優(yōu)化方法如梯度下降方法、隨機(jī)梯度下降方法、Newton方法，了解一點(diǎn)等式約束優(yōu)化和不等式約束優(yōu)化方法，即可滿足理解深度學(xué)習(xí)中優(yōu)化方法的理論要求。這里推薦一本教材，Stephen Boyd的《Convex OpTImizaTIon》。

機(jī)器學(xué)習(xí)

歸根結(jié)底，深度學(xué)習(xí)只是機(jī)器學(xué)習(xí)方法的一種，而統(tǒng)計(jì)機(jī)器學(xué)習(xí)則是機(jī)器學(xué)習(xí)領(lǐng)域事實(shí)上的方法論。以監(jiān)督學(xué)習(xí)為例，需要你掌握線性模型的回歸與分類、支持向量機(jī)與核方法、隨機(jī)森林方法等具有代表性的機(jī)器學(xué)習(xí)技術(shù)，并了解模型選擇與模型推理、模型正則化技術(shù)、模型集成、Bootstrap方法、概率圖模型等。深入一步的話，還需要了解半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等專門技術(shù)。這里推薦一本經(jīng)典教材《The elements of StaTIsTIcal Learning》。

計(jì)算機(jī)基礎(chǔ)

深度學(xué)習(xí)要在實(shí)戰(zhàn)中論英雄，因此具備GPU服務(wù)器的硬件選型知識，熟練操作Linux系統(tǒng)和進(jìn)行Shell編程，熟悉C++和Python語言，是成長為深度學(xué)習(xí)實(shí)戰(zhàn)高手的必備條件。當(dāng)前有一種提法叫“全棧深度學(xué)習(xí)工程師”，這也反映出了深度學(xué)習(xí)對于從業(yè)者實(shí)戰(zhàn)能力的要求程度：既需要具備較強(qiáng)的數(shù)學(xué)與機(jī)器學(xué)習(xí)理論基礎(chǔ)，又需要精通計(jì)算機(jī)編程與必要的體系結(jié)構(gòu)知識。

編程語言

在深度學(xué)習(xí)中，使用最多的兩門編程語言分別是C++和Python。迄今為止，C++語言依舊是實(shí)現(xiàn)高性能系統(tǒng)的首選，目前使用最廣泛的幾個深度學(xué)習(xí)框架，包括Tensorflow、Caffe、MXNet，其底層均無一例外地使用C++編寫。而上層的腳本語言一般為Python，用于數(shù)據(jù)預(yù)處理、定義網(wǎng)絡(luò)模型、執(zhí)行訓(xùn)練過程、數(shù)據(jù)可視化等。當(dāng)前，也有Lua、R、Scala、Julia等語言的擴(kuò)展包出現(xiàn)于MXNet社區(qū)，呈現(xiàn)百花齊放的趨勢。這里推薦兩本教材，一本是《C++ Primer第五版》，另外一本是《Python核心編程第二版》。

Linux操作系統(tǒng)

深度學(xué)習(xí)系統(tǒng)通常運(yùn)行在開源的Linux系統(tǒng)上，目前深度學(xué)習(xí)社區(qū)較為常用的Linux發(fā)行版主要是Ubuntu。對于Linux操作系統(tǒng)，主要需要掌握的是Linux文件系統(tǒng)、基本命令行操作和Shell編程，同時還需熟練掌握一種文本編輯器，比如VIM?；静僮鲃?wù)必要做到熟練，當(dāng)需要批量替換一個文件中的某個字符串，或者在兩臺機(jī)器之間用SCP命令拷貝文件時，你不需要急急忙忙去打開搜索引擎。這里推薦一本工具書《鳥哥的Linux私房菜》。

CUDA編程

深度學(xué)習(xí)離不開GPU并行計(jì)算，而CUDA是一個很重要的工具。CUDA開發(fā)套件是NVidia提供的一套GPU編程套件，實(shí)踐當(dāng)中應(yīng)用的比較多的是CUDA-BLAS庫。這里推薦NVidia的官方在線文檔。

其他計(jì)算機(jī)基礎(chǔ)知識

掌握深度學(xué)習(xí)技術(shù)不能只滿足于使用Python調(diào)用幾個主流深度學(xué)習(xí)框架，從源碼著手去理解深度學(xué)習(xí)算法的底層實(shí)現(xiàn)是進(jìn)階的必由之路。這個時候，掌握數(shù)據(jù)結(jié)構(gòu)與算法（尤其是圖算法）知識、分布式計(jì)算（理解常用的分布式計(jì)算模型），和必要的GPU和服務(wù)器的硬件知識（比如當(dāng)我說起CPU的PCI-E通道數(shù)和GPU之間的數(shù)據(jù)交換瓶頸時，你能心領(lǐng)神會），你一定能如虎添翼。

深度學(xué)習(xí)入門

接下來分別從理論和實(shí)踐兩個角度來介紹一下深度學(xué)習(xí)的入門。

深度學(xué)習(xí)理論入門

我們可以用一張圖（圖1）來回顧深度學(xué)習(xí)中的關(guān)鍵理論和方法。從MCP神經(jīng)元模型開始，首先需要掌握卷積層、Pooling層等基礎(chǔ)結(jié)構(gòu)單元，Sigmoid等激活函數(shù)，Softmax等損失函數(shù)，以及感知機(jī)、MLP等經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)。接下來，掌握網(wǎng)絡(luò)訓(xùn)練方法，包括BP、Mini-batch SGD和LR Policy。最后還需要了解深度網(wǎng)絡(luò)訓(xùn)練中的兩個至關(guān)重要的理論問題：梯度消失和梯度溢出。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點(diǎn)：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運(yùn)營商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]