Pinterest依靠機器學(xué)習(xí)抓住用戶的心
目前,Pinterest月平均活躍用戶量達到1億,這家以圖片為主的公司是如何留住用戶并盈利的呢?Pinterest的主要目標(biāo)是向用戶推薦相關(guān)的圖片或內(nèi)容,推薦的內(nèi)容足夠精確才能提高用戶黏性。近期,《快公司》發(fā)文表示,Pinterest 正從機器學(xué)習(xí)切入,向用戶推薦更精準(zhǔn)的內(nèi)容,并拓展新的在線業(yè)務(wù)。
在Pinterest 平臺上,人們可以搜索、下載全網(wǎng)范圍內(nèi)的圖片和文章,找到與自己喜好契合的內(nèi)容自然能夠增加他們的用戶忠誠度。Pinterest 推薦的相關(guān)內(nèi)容提高了30% 的參與度和 25% 的購買度。這些精準(zhǔn)推薦都是依托尖端的數(shù)據(jù)驅(qū)動技術(shù)和大量實驗的結(jié)果。
用戶可以通過Pinterest 臺的虛擬釘板收藏全網(wǎng)范圍的在線商品、帖子、圖片,就是說這個平臺完全是基于用戶興趣偏好建立的。Pinterest 無需像其他社交網(wǎng)絡(luò)一樣,根據(jù)用戶的點擊模式或者特定頁面停留時間來猜測其興趣。這也意味著它的算法能推測到 750億個收藏的內(nèi)容數(shù)據(jù)庫中相互關(guān)聯(lián)的信息,因為相似的內(nèi)容更容易被固定在同一個釘板上,從而輕易識別用戶偏好。
Pinterest 可以說是一個社交圖,由數(shù)十億相互聯(lián)系的用戶、被不同用戶收藏的同一個項目、收藏類似項目的虛擬釘板三部分構(gòu)成,這樣的組成結(jié)構(gòu)同時決定了其用戶量將會不斷增長。
Pinterest 的高級發(fā)現(xiàn)科學(xué)工程師 Mohammad Shahangian 說,“我們通過數(shù)百次的實驗對我們的算法做出微小修正,確定發(fā)現(xiàn)問題的方向“。簡單地根據(jù)用戶關(guān)注人群決定為其推薦內(nèi)容的模型是不理想的,假設(shè)一個用戶正在策劃自己的婚禮,她的虛擬釘板添加了很多禮服款式的圖片,而她的關(guān)注者并不一定需要這類服飾,為他們推薦禮服可能造成無意義的重復(fù)。而 Pinterest 所有的數(shù)據(jù)可以讓 Pinterest 的用戶獲得 。
Shahangian 表示,“ 如果你的虛擬釘板收藏了一個廚房水槽的鏈接,我們是否需要向你推送一萬多款廚房水槽,或啟發(fā)你怎么能整體設(shè)計你的廚房呢?” 為了在這樣的情況下做出正確判斷,該公司的工程師們測試了多種機器學(xué)習(xí)算法,來研究不同公式如何執(zhí)行對相似或不同的測試集的收藏,以及他們最終如何影響現(xiàn)實世界的用戶的參與度。
然而,事實上,Pinterest 的技術(shù)研發(fā)缺乏實例測試,研究員無法通過給某個特定的用戶付錢來測試他是否會接受一組新的推薦。雖然后面的測試過程無法進行,目前的算法已經(jīng)基本可以實現(xiàn)通過用戶的收藏內(nèi)容來判定此人是否愿意擔(dān)任人工測試者。Pintesrest 從自身的一路發(fā)展中收獲了不少啟發(fā),個性化一直是提高用戶參與度最大的影響因素之一。與此同時,該公司也一直致力于提高視覺搜索功能,幫助用戶獲取與目標(biāo)圖片相似的內(nèi)容。 今年早些時候,Pinterest 的工程師們與來自伯克利加利福尼亞大學(xué)視覺與學(xué)習(xí)中心的研究人員一起開發(fā)了可自動檢測圖像內(nèi)容的深度學(xué)習(xí)技術(shù)。
Pinterest 的高級視覺搜索工程師 Dmitry Kislyuk 說,當(dāng)我們試圖去分辯圖片內(nèi)容是一只貓還是一條狗時,這并不算一個分類任務(wù),關(guān)鍵在于保證實時性的前提下尋找圖像之間的視覺相似性??梢暬阉鞴ぞ哂绕溥m合收集家居裝飾和時尚類商品的信息。未來,公司希望提高將目標(biāo)內(nèi)容映射到其類別的能力,舉例來講,當(dāng)用戶想找同一種食材的新食譜時,就不要只提供這種食材的類似照片。
高級視覺搜索工程師 Andrew Zhai 指出, “我認為我們的模型可以更語義化,有效地將深度學(xué)習(xí)應(yīng)用于映射更加概念化的圖像。與此同時,Pinterest 的的工程師們正在專注于完善目標(biāo)的檢測和搜索開發(fā)一款應(yīng)用程序,讓智能手機用戶通過給現(xiàn)實世界中需求物品拍照,上傳到平臺后,得到相關(guān)的推薦。