機器學(xué)習(xí)成就了互聯(lián)網(wǎng)搜索
當(dāng)你打開互聯(lián)網(wǎng)搜索引擎,輸入關(guān)鍵詞尋找并得到想要的鏈接時,“機器學(xué)習(xí)”已經(jīng)貫穿整個過程:搜索到的內(nèi)容是機器根據(jù)無數(shù)人搜索關(guān)鍵詞的統(tǒng)計結(jié)果,返回的最可能被需要的目標(biāo)信息;而同時,你的這一次搜索行為也已經(jīng)被機器記錄,加入到它的龐大無比的數(shù)據(jù)庫中,用來了解人的搜索習(xí)慣和需求。
隨著計算機與網(wǎng)絡(luò)的飛速發(fā)展,機器學(xué)習(xí)作用越來越大,正在改變著我們的生活和工作?;ヂ?lián)網(wǎng)搜索、在線廣告、機器翻譯、手寫識別、垃圾郵件過濾等等都是以機器學(xué)習(xí)為核心技術(shù)的。
微軟亞洲研究院互聯(lián)網(wǎng)搜索與挖掘組高級研究員李航博士介紹說,機器學(xué)習(xí)是關(guān)于計算機基于數(shù)據(jù)構(gòu)建模型并運用模型來模擬人類智能活動的一門學(xué)科。機器學(xué)習(xí)實際上體現(xiàn)了計算機向智能化發(fā)展的必然趨勢。現(xiàn)在當(dāng)人們提到機器學(xué)習(xí)時,通常是指統(tǒng)計機器學(xué)習(xí)或統(tǒng)計學(xué)習(xí)。實踐表明,統(tǒng)計機器學(xué)習(xí)是實現(xiàn)計算機智能化這一目標(biāo)的最有效手段。
機器學(xué)習(xí)最大的優(yōu)點是它具有泛化能力,也就是可以舉一反三。無論是在什么樣的圖片中,甚至是在抽象畫中,人們能夠輕而易舉地找出其中的人臉,這種能力就是泛化能力。
當(dāng)然,統(tǒng)計學(xué)習(xí)的預(yù)測準(zhǔn)確率不能保證100%。
李航說,機器學(xué)習(xí)是“鄉(xiāng)下人”的辦法。有個笑話。一個鄉(xiāng)下人進城,到餐館吃飯,不知如何在餐館用餐,就模仿旁邊的人。別人做什么,他也就學(xué)著做什么。鄰桌的一位故意戲弄他,將桌上的蠟燭卷在餅里,趁鄉(xiāng)下人不注意時把蠟燭扔到地上,然后咬了一口卷著的餅。鄉(xiāng)下人也跟著學(xué),大咬了一口自己的餅。機器學(xué)習(xí)只是根據(jù)觀測,“模仿”人的智能行為,有時能夠顯得非常智能化。但如果觀測不到關(guān)鍵的特征,它就會去“咬卷著蠟燭的餅”。
據(jù)調(diào)查,60%的互聯(lián)網(wǎng)用戶每天至少使用一次搜索引擎,90%的互聯(lián)網(wǎng)用戶每周至少使用一次搜索引擎。搜索引擎大大提高了人們工作、學(xué)習(xí)以及生活的質(zhì)量。而互聯(lián)網(wǎng)搜索的基本技術(shù)中,機器學(xué)習(xí)占據(jù)著重要的位置。