神經(jīng)網(wǎng)絡是一種系統(tǒng),或者說是神經(jīng)元的結(jié)構(gòu),它使人工智能能夠更好地理解數(shù)據(jù),從而解決復雜的問題。雖然網(wǎng)絡類型多種多樣,但本系列文章將僅關注卷積神經(jīng)網(wǎng)絡 (CNN)。CNN 的主要應用領域是模式識別和對輸入數(shù)據(jù)中包含的對象進行分類。CNN 是一種用于深度學習的人工神經(jīng)網(wǎng)絡。這種網(wǎng)絡由一個輸入層、幾個卷積層和一個輸出層組成。卷積層是最重要的組件,因為它們使用一組獨特的權(quán)重和過濾器,使網(wǎng)絡能夠從輸入數(shù)據(jù)中提取特征。數(shù)據(jù)可以有多種不同的形式,例如圖像、音頻和文本。這種特征提取過程使 CNN 能夠識別數(shù)據(jù)中的模式。通過從數(shù)據(jù)中提取特征,CNN 使工程師能夠創(chuàng)建更有效、更高效的應用程序。為了更好地理解 CNN,我們將首先討論經(jīng)典的線性規(guī)劃。
本文重點介紹卷積神經(jīng)網(wǎng)絡 (CNN) 的特性和應用,主要用于模式識別和對象分類。在之前文章中,我們展示了微控制器中經(jīng)典線性程序執(zhí)行與 CNN 的區(qū)別及其優(yōu)勢。我們討論了 CIFAR 網(wǎng)絡,利用該網(wǎng)絡可以對圖像中的貓、房屋或自行車等對象進行分類,或執(zhí)行簡單的語音模式識別。本文解釋了如何訓練這些神經(jīng)網(wǎng)絡來解決問題。
AI應用程序需要大量的能源消耗,通常是以服務器儲存所或昂貴的現(xiàn)場可編程門陣列的形式出現(xiàn)。挑戰(zhàn)在于提高計算能力,同時保持低能耗和低成本?,F(xiàn)在,人工智能的應用正在看到強大的智能邊緣計算帶來的巨大變化。與傳統(tǒng)的基于硬件的計算方法相比,基于硬件的卷積神經(jīng)網(wǎng)絡加速度正以其令人印象深刻的速度和功率,為計算性能開創(chuàng)一個新的時代。通過使傳感器節(jié)點能夠自己做出決定,智能邊緣技術極大地降低了5G和Wi-Fi網(wǎng)絡的數(shù)據(jù)傳輸速率。這正在為以前不可能的新興技術和獨特應用提供動力。例如,偏遠地區(qū)的煙霧/火災探測器或傳感器層面的環(huán)境數(shù)據(jù)分析都已成為現(xiàn)實--所有這些都隨著電池的使用年限而發(fā)生變化。為了檢驗這些功能是如何實現(xiàn)的,本文探索了一個CNN的硬件轉(zhuǎn)換,一個專用的人工智能微控制器。
本系列文章由三部分組成,主要探討卷積神經(jīng)網(wǎng)絡(CNN)的特性和應用。CNN主要用于模式識別和對象分類。作為系列文章的第三部分,本文重點解釋如何使用硬件轉(zhuǎn)換卷積神經(jīng)網(wǎng)絡(CNN),并特別介紹使用帶CNN硬件加速器的人工智能(AI)微控制器在物聯(lián)網(wǎng)(IoT)邊緣實現(xiàn)人工智能應用所帶來的好處。系列文章的前兩篇文章為《卷積神經(jīng)網(wǎng)絡簡介:什么是機器學習?——第一部分》和《訓練卷積神經(jīng)網(wǎng)絡:什么是機器學習?——第二部分》。
本文是系列文章的第二部分,重點介紹卷積神經(jīng)網(wǎng)絡(CNN)的特性和應用。CNN主要用于模式識別和對象分類。在第一部分文章《卷積神經(jīng)網(wǎng)絡簡介:什么是機器學習?——第一部分》中,我們比較了在微控制器中運行經(jīng)典線性規(guī)劃程序與運行CNN的區(qū)別,并展示了CNN的優(yōu)勢。我們還探討了CIFAR網(wǎng)絡,該網(wǎng)絡可以對圖像中的貓、房子或自行車等對象進行分類,還可以執(zhí)行簡單的語音識別。本文重點解釋如何訓練這些神經(jīng)網(wǎng)絡以解決實際問題。
隨著人工智能(AI)技術的快速發(fā)展,AI可以越來越多地支持以前無法實現(xiàn)或者難以實現(xiàn)的應用。本系列文章基于此解釋了卷積神經(jīng)網(wǎng)絡(CNN)及其對人工智能和機器學習的意義。CNN是一種能夠從復雜數(shù)據(jù)中提取特征的強大工具,例如識別音頻信號或圖像信號中的復雜模式就是其應用之一。本文討論了CNN相對于經(jīng)典線性規(guī)劃的優(yōu)勢,后續(xù)文章《訓練卷積神經(jīng)網(wǎng)絡:什么是機器學習?——第二部分》將討論如何訓練CNN模型,系列文章的第三部分將討論一個特定用例,并使用專門的AI微控制器對模型進行測試。
卷積神經(jīng)網(wǎng)絡的發(fā)展,最早可以追溯到1962年,Hubel和Wiesel對貓大腦中的視覺系統(tǒng)的研究。1980年,一個日本科學家福島邦彥(Kunihiko Fukushima)提出了一個包含卷積層、池化層的神經(jīng)網(wǎng)絡結(jié)構(gòu)。在這個基礎上,Yann Lecun將BP算法應用到這個神經(jīng)網(wǎng)絡結(jié)構(gòu)的訓練上,就形成了當代卷積神經(jīng)網(wǎng)絡的雛形。
摘 要 :針對傳統(tǒng)神經(jīng)網(wǎng)絡需要人工對參數(shù)進行提取的問題,提出基于 Leap Motion 結(jié)合卷積神經(jīng)網(wǎng)絡的手勢識別方法。首先利用 Leap Motion 獲取高精度手勢圖像,然后對圖像進行灰度處理,采用卷積神經(jīng)網(wǎng)絡算法自動對原始圖像進行特征提取及分類,最后設計 6 層卷積神經(jīng)網(wǎng)絡用于手勢識別。實驗結(jié)果表明,卷積神經(jīng)網(wǎng)絡算法在6 種手勢測試集上的準確率可達 96.5%,且識別時間短,模型具有較好的魯棒性。
摘 要 :現(xiàn)代人臉識別以深度學習技術為核心,以卷積神經(jīng)網(wǎng)絡為基礎,通過輸入圖像提取到人臉的特征值計算分析人臉的表情。通過分析當前學生的專注度(表情變化),建立數(shù)據(jù)采集樣本集,通過訓練計算完成課堂專注度分析,形成課堂學生專注度分布結(jié)果。結(jié)果表明,進行教師的課堂學情分析,有利于進行課程的教育教學改革, 提高辦學水平,也有利于教育行業(yè)的技術進步,提高行業(yè)的信息技術教育水平。
摘 要 :手勢識別是人工智能范疇的一項生物識別技術,其方便、快捷、可靠和穩(wěn)定等一系列特性使其在多個領域具有廣泛應用。如拍照和視頻中使用手勢增加貼紙和實時特效,將復雜的手語轉(zhuǎn)化為自然語言,智能家居的輔助控制,輔助駕駛系統(tǒng)等。神經(jīng)網(wǎng)絡被廣泛應用于圖像識別領域,具有較好的口碑。文章基于深度學習理論設計一種識別精度高,能夠?qū)崿F(xiàn)實時手勢識別的算法。
作者|小白來源|小白學視覺疲勞駕駛:一個嚴重的問題美國國家公路交通安全管理局估計,每年有91,000起車禍涉及疲勞駕駛的司機,造成約50,000人受傷和近800人死亡。此外,每24名成年司機中就有1人報告在過去30天內(nèi)在駕駛時睡著了。研究甚至發(fā)現(xiàn),超過20個小時不睡覺相當于血液酒...
摘 要:當前,采用卷積神經(jīng)網(wǎng)絡進行圖像目標檢測和識別是一大研究熱點,并取得了不少研究成果。這些成果在研究過程中使用大量有標簽的訓練樣本作為訓練集起了至關重要的作用。文章以人臉識別為例,闡述了多樣本獲取現(xiàn)狀;討論了基于傳統(tǒng)方法的多樣本算法研究現(xiàn)狀和基于深度學習的多樣本算法研究現(xiàn)狀;最后展望了多樣本算法未來的發(fā)展方向。
摘 要:文中對傳統(tǒng)的卷積神經(jīng)網(wǎng)絡Lenet-5的結(jié)構(gòu)進行了改進,并利用拍攝的實景交通標志圖對其進行訓練。訓練集含有10萬張圖片,訓練大約消耗了一天時間,盡管如此,當網(wǎng)絡訓練好之后,識別一張交通標志圖可以在1毫秒內(nèi)完成。非訓練集的2萬張圖片被用作測試集來驗證已訓練好的網(wǎng)絡,最終識別率可達80%以上。
目前,作為深度學習的代表算法之一,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)在計算機視覺、分類等領域上,都取得了當前最好的效果。
20世紀60年代,Hubel和Wiesel在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時發(fā)現(xiàn)其獨特的網(wǎng)絡結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡的復雜性,繼而提出了卷積神經(jīng)網(wǎng)絡CNN(ConvoluTI
在人工智能(AI)深度學習的領域中,卷積神經(jīng)網(wǎng)絡(ConvoluTIonal Neural Network;CNN)已是目前最具代表性的發(fā)展技術之一;然而不論是CNN模型或臨床醫(yī)師,在針對視網(wǎng)膜
無人機技術的發(fā)展十分迅速。從美軍無人機的使用,到現(xiàn)在無人機在研究、民用等多方面的普及,無人機已成為一種新的潮流[1-2]。隨之而來也帶來很多新問題,此前無人機險撞戰(zhàn)機事件的發(fā)生,就給人們敲響了警
卷積神經(jīng)網(wǎng)絡 經(jīng)網(wǎng)絡結(jié)構(gòu)圖 圖2 卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)圖 卷積神經(jīng)網(wǎng)絡和全連接的神經(jīng)網(wǎng)絡結(jié)構(gòu)上的差異還是比較大的,全連接的網(wǎng)絡,相鄰兩層的節(jié)點都有邊相連,
人們常說眼睛是心靈的窗戶,但是谷歌的研究人員把它們視作人們健康的指示器。谷歌正借助深度學習技術,通過分析人們的視網(wǎng)膜圖像預測一個人的血壓、年齡和吸煙狀態(tài)。谷歌的計算機能夠從血管的排布中獲取線索,
前面幾篇文章講到了卷積神經(jīng)網(wǎng)絡CNN,但是對于它在每一層提取到的特征以及訓練的過程可能還是不太明白,所以這節(jié)主要通過模型的可視化來神經(jīng)網(wǎng)絡在每一層中是如何訓練的。我們知道,神經(jīng)網(wǎng)絡本身包含了一系