新興技術(shù)風靡全球。他們釋放的創(chuàng)新,機遇和威脅與眾不同。隨著它們的增長,對這些領(lǐng)域的專家的需求也在增長。根據(jù)最新行業(yè)報告的調(diào)查結(jié)果,機器學習,人工智能和數(shù)據(jù)科學等新興技術(shù)的工作在新興工作中名列前茅。機器學習,人工智能或數(shù)據(jù)科學等新興技術(shù)的職業(yè)生涯可以獲得高額利潤,也可以獲得智力刺激。
機器學習是人工智能的一個子集,它為機器提供了自動學習和改進的能力,無需任何明確的編程。而深度學習,機器學習的子集,能夠做出直覺決策的人工神經(jīng)網(wǎng)絡(luò)。
你對Recall和Precision這個術(shù)語有什幺了解?召回被稱為真正的正面率。它指的是您的模型聲明的陽性數(shù)量與整個數(shù)據(jù)中可用陽性數(shù)量的比較。精度,或者稱為正預測值,基于預測。它是模型聲稱的準確陽性數(shù)量的測量值,與模型實際聲明的陽性數(shù)量相比較。
監(jiān)督機器學習和無監(jiān)督機器學習之間的區(qū)別?在監(jiān)督學習中,機器在標記數(shù)據(jù)的幫助下進行訓練,即用正確答案標記的數(shù)據(jù)。而在無監(jiān)督機器學習中,模型通過自己發(fā)現(xiàn)信息來學習。與監(jiān)督學習模型相比,無監(jiān)督模型更適合于執(zhí)行困難的處理任務(wù)。
K-means是一種無監(jiān)督算法,用于聚類問題的過程,KNN或K最近鄰是一種監(jiān)督算法,用于回歸和分類過程。這兩個概念都是監(jiān)督機器學習技術(shù)的一個重要方面。通過分類,輸出被分類為用于進行預測的不同類別。而回歸模型通常用于找出預測和變量之間的關(guān)系。分類和回歸之間的關(guān)鍵區(qū)別在于,在前者中,輸出變量是離散的,而在后者中是連續(xù)的。
您將如何處理數(shù)據(jù)集中的缺失數(shù)據(jù)?數(shù)據(jù)科學家面臨的最大挑戰(zhàn)之一是數(shù)據(jù)丟失問題。您可以通過多種方式對缺失值進行歸因,包括分配唯一類別,刪除行,使用均值/中值/模式替換,使用支持缺失值的算法,以及預測缺失值等等。
您對歸納邏輯編程(ILP)有何了解?機器學習的子領(lǐng)域,歸納邏輯編程通過使用邏輯編程來開發(fā)預測模型來搜索數(shù)據(jù)中的模式。該過程假定邏輯程序是假設(shè)或背景知識。
您需要采取哪些步驟來確保不會過度使用特定型號?當模型在訓練期間提供大量數(shù)據(jù)時,它開始從數(shù)據(jù)集中的噪聲和其他錯誤數(shù)據(jù)中學習。這使得模型難以學習除了訓練集之外概括新實例。有叁種方法可以避免機器學習中的過度擬合。第一種方法是保持模型簡單,第二種方法是使用交叉驗證技術(shù),第叁種方法是使用正則化技術(shù),例如LASSO。
什幺是合奏學習?或者,集合方法被稱為學習多分類器系統(tǒng)或基于委員會的學習。集合方法是指構(gòu)建分類器集的學習算法,然后對新數(shù)據(jù)點進行分類以選擇其預測。該方法訓練了許多假設(shè)以解決相同的問題。集合建模的最佳示例是隨機森林樹,其中許多決策樹用于預測結(jié)果。
命名機器學習項目中所需的步驟?實現(xiàn)良好工作模型應采取的一些關(guān)鍵步驟是收集數(shù)據(jù),準備數(shù)據(jù),選擇機器學習模型,模型訓練,評估模型,調(diào)整參數(shù),最后是預測。