機(jī)器學(xué)習(xí)大佬開(kāi)講了,傳統(tǒng)機(jī)器學(xué)習(xí)研究方向包括哪些?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
以下內(nèi)容中,小編將對(duì)機(jī)器學(xué)習(xí)的相關(guān)內(nèi)容進(jìn)行著重介紹和闡述,希望本文能幫您增進(jìn)對(duì)機(jī)器學(xué)習(xí)的了解,和小編一起來(lái)看看吧。
傳統(tǒng)機(jī)器學(xué)習(xí)的研究方向主要包括決策樹(shù)、隨機(jī)森林、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯學(xué)習(xí)等方面的研究。
決策樹(shù)是機(jī)器學(xué)習(xí)常見(jiàn)的一種方法。20世紀(jì)末期,機(jī)器學(xué)習(xí)研究者J.Ross Quinlan將Shannon的信息論引入到了決策樹(shù)算法中,提出了ID3算法。1984年I.Kononenko、E.Roskar和I.Bratko在ID3算法的基礎(chǔ)上提出了AS-SISTANTAlgorithm,這種算法允許類(lèi)別的取值之間有交集。同年,A.Hart提出了Chi-Squa統(tǒng)計(jì)算法,該算法采用了一種基于屬性與類(lèi)別關(guān)聯(lián)程度的統(tǒng)計(jì)量。1984年L.Breiman、C.Ttone、R.Olshen和J.Freidman提出了決策樹(shù)剪枝概念,極大地改善了決策樹(shù)的性能。1993年,Quinlan在ID3算法的基礎(chǔ)上提出了一種改進(jìn)算法,即C4.5算法。C4.5算法克服了ID3算法屬性偏向的問(wèn)題增加了對(duì)連續(xù)屬性的處理通過(guò)剪枝,在一定程度上避免了“過(guò)度適合”現(xiàn)象。但是該算法將連續(xù)屬性離散化時(shí),需要遍歷該屬性的所有值,降低了效率,并且要求訓(xùn)練樣本集駐留在內(nèi)存,不適合處理大規(guī)模數(shù)據(jù)集。2010年Xie提出一種CART算法,該算法是描述給定預(yù)測(cè)向量X條件分布變量Y的一個(gè)靈活方法,已經(jīng)在許多領(lǐng)域得到了應(yīng)用。CART算法可以處理無(wú)序的數(shù)據(jù),采用基尼系數(shù)作為測(cè)試屬性的選擇標(biāo)準(zhǔn)。CART算法生成的決策樹(shù)精確度較高,但是當(dāng)其生成的決策樹(shù)復(fù)雜度超過(guò)一定程度后,隨著復(fù)雜度的提高,分類(lèi)精確度會(huì)降低,所以該算法建立的決策樹(shù)不宜太復(fù)雜。2007年房祥飛表述了一種叫SLIQ(決策樹(shù)分類(lèi))算法,這種算法的分類(lèi)精度與其他決策樹(shù)算法不相上下,但其執(zhí)行的速度比其他決策樹(shù)算法快,它對(duì)訓(xùn)練樣本集的樣本數(shù)量以及屬性的數(shù)量沒(méi)有限制。SLIQ算法能夠處理大規(guī)模的訓(xùn)練樣本集,具有較好的伸縮性;執(zhí)行速度快而且能生成較小的二叉決策樹(shù)。SLIQ算法允許多個(gè)處理器同時(shí)處理屬性表,從而實(shí)現(xiàn)了并行性。但是SLIQ算法依然不能擺脫主存容量的限制。2000年RajeevRaSto等提出了PUBLIC算法,該算法是對(duì)尚未完全生成的決策樹(shù)進(jìn)行剪枝,因而提高了效率。近幾年模糊決策樹(shù)也得到了蓬勃發(fā)展。研究者考慮到屬性間的相關(guān)性提出了分層回歸算法、約束分層歸納算法和功能樹(shù)算法,這三種算法都是基于多分類(lèi)器組合的決策樹(shù)算法,它們對(duì)屬性間可能存在的相關(guān)性進(jìn)行了部分實(shí)驗(yàn)和研究,但是這些研究并沒(méi)有從總體上闡述屬性間的相關(guān)性是如何影響決策樹(shù)性能。此外,還有很多其他的算法,如Zhang.J于2014年提出的一種基于粗糙集的優(yōu)化算法、Wang.R在2015年提出的基于極端學(xué)習(xí)樹(shù)的算法模型等。
隨機(jī)森林(RF)作為機(jī)器學(xué)習(xí)重要算法之一,是一種利用多個(gè)樹(shù)分類(lèi)器進(jìn)行分類(lèi)和預(yù)測(cè)的方法。近年來(lái),隨機(jī)森林算法研究的發(fā)展十分迅速,已經(jīng)在生物信息學(xué)、生態(tài)學(xué)、醫(yī)學(xué)、遺傳學(xué)、遙感地理學(xué)等多領(lǐng)域開(kāi)展的應(yīng)用性研究。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)是一種具有非線性適應(yīng)性信息處理能力的算法,可克服傳統(tǒng)人工智能方法對(duì)于直覺(jué),如模式、語(yǔ)音識(shí)別、非結(jié)構(gòu)化信息處理方面的缺陷。早在20世紀(jì)40年代人工神經(jīng)網(wǎng)絡(luò)已經(jīng)受到關(guān)注,并隨后得到迅速發(fā)展。
貝葉斯學(xué)習(xí)是機(jī)器學(xué)習(xí)較早的研究方向,其方法最早起源于英國(guó)數(shù)學(xué)家托馬斯,貝葉斯在1763年所證明的一個(gè)關(guān)于貝葉斯定理的一個(gè)特例。經(jīng)過(guò)多位統(tǒng)計(jì)學(xué)家的共同努力,貝葉斯統(tǒng)計(jì)在20世紀(jì)50年代之后逐步建立起來(lái),成為統(tǒng)計(jì)學(xué)中一個(gè)重要的組成部分。
經(jīng)由小編的介紹,不知道你對(duì)它是否充滿了興趣?如果你想對(duì)它有更多的了解,不妨嘗試度娘更多信息或者在我們的網(wǎng)站里進(jìn)行搜索哦。