機器學習是一門多學科交叉專業(yè),涵蓋概率論知識,統(tǒng)計學知識,近似理論知識和復雜算法知識,使用計算機作為工具并致力于真實實時的模擬人類學習方式, 并將現有內容進行知識結構劃分來有效提高學習效率。機器學習專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智能核心,是使計算機具有智能的根本途徑。
根據統(tǒng)計學原理,在大量的統(tǒng)計數據中,如果讓無法理解題目的大猩猩純粹瞎蒙,最終也可以得到33%的正確率,然而人類根據已有的印象答題,反而錯的更多,由此也體現了一個問題:相對于事實,人們印象中的這個世界比真實的世界更加可怕、暴力!
大數據(big data)是指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。大數據本身是基于數據價值化而構建出來的新概念,雖然概念比較新,但是數據卻一直都在,所以大數據的核心并不在“大”上,而是基于大數據所構建出的一個新的價值空間。
不知道為什么,自己突然就特別想要學習機器學習方面的知識。這種感覺特別的強烈,或許這就是對新知識的渴望吧。 《統(tǒng)計學習方法》這本書有點偏理論,有很多關于數學和統(tǒng)計學的知識(似然函數、)。此書系統(tǒng)全面的
我不是試圖用通俗的語言來解釋清楚什么是假設檢驗,如何去實踐。 做到能用理 論化的語言來描述和理解問題是科研工作者應該掌握的能力。其實這個不難,只要 把基本問題吃透了,就可以在基本問題上繼續(xù)問題。本文中
由于統(tǒng)計學在現實生活和“高端”科學研究中有著很高的地位,時常思考統(tǒng)計相關的問題,加深對它的基礎理論的理解應該對我們理解和研究現實世界有幫助。1、樣本空間與總體的關系樣本空間,在茆詩松等編著的《概率論與