為什么人們會買一些與自己購物搜索預(yù)期不同的東西?這是一個值得思考的問題。
Alexa 購物團隊負責搜索功能的高級經(jīng)理 Liane Lewin-Eytan 在自己的博客中解釋道:
比如,人們對 Alexa 發(fā)出搜索指令,通過購物搜索算法,Alexa 最終會羅列出一些產(chǎn)品供用戶挑選,那些能滿足用戶需求的產(chǎn)品可以理解為“相關(guān)產(chǎn)品”。而這些“相關(guān)產(chǎn)品”的最終呈現(xiàn)依賴于人工注釋員的判斷。
簡而言之,人工注釋員會標記出符合用戶預(yù)期的相關(guān)產(chǎn)品,而其他產(chǎn)品則為不相關(guān)產(chǎn)品。有趣的是,亞馬遜方面最近發(fā)現(xiàn),用戶經(jīng)常會與注釋員標記為不相關(guān)的產(chǎn)品產(chǎn)生聯(lián)系。
舉個例子,人工注釋員會將“購買漢堡”的詞條與漢堡產(chǎn)品聯(lián)系起來,而不是將該詞條與“漢堡機”聯(lián)系起來,但亞馬遜發(fā)現(xiàn),發(fā)出“購買漢堡”這一指令的用戶可能會買看似無關(guān)的漢堡機,并不會買真正的漢堡。
亞馬遜將用戶的這種行為進行了分類,第一種是直接購買不相關(guān)產(chǎn)品,就像前面舉的漢堡機的例子;第二種是與不相關(guān)產(chǎn)品“互動”,例如將不相關(guān)產(chǎn)品添加到購物車,或是分享給其他用戶。
亞馬遜的研究表明,在面對銷量高的或者是更加便宜產(chǎn)品時,用戶購買不相關(guān)產(chǎn)品的可能性更高;而且,相比起美容產(chǎn)品和雜貨產(chǎn)品類別,人們在諸如玩具和數(shù)碼產(chǎn)品等類別中購買不相關(guān)產(chǎn)品的可能性更大。
為了進一步了解用戶的這一行為,亞馬遜研究人員作出了許多努力。
首先,研究團隊使用統(tǒng)計方法來識別長短不一的關(guān)鍵詞的搜索結(jié)果。研究發(fā)現(xiàn),相比起中等長度的搜索關(guān)鍵詞,通過簡短/相對冗長的關(guān)鍵詞搜索的用戶在購買決策方面更加靈活。因此,他們認為,短關(guān)鍵詞表示用戶的不確定性和探索的意愿,長關(guān)鍵詞會降低精確匹配的可能性;這兩種方式都會讓用戶與不相關(guān)產(chǎn)品產(chǎn)生關(guān)聯(lián)的可能性增大。
另外,研究人員還考慮了搜索結(jié)果中相關(guān)產(chǎn)品和不相關(guān)產(chǎn)品之間的間接關(guān)系。例如,兩個產(chǎn)品是相同風格、品牌或類別,或者它們經(jīng)常是配套購買的,那么,它們之間就存在著間接關(guān)系。
研究人員使用了兩種不同的間接關(guān)系度量方法,一種基于描述性術(shù)語的含義,另一種基于購買歷史。這兩個因素都會影響用戶購買不相關(guān)產(chǎn)品的可能性。
上述大都是數(shù)據(jù)統(tǒng)計方面的分析,亞馬遜還進行了兩次實驗,以評估搜索結(jié)果中看似不相關(guān)的產(chǎn)品的價值。
首先,研究人員進行了 1500 次搜索查詢,每次查詢都記錄一個相關(guān)產(chǎn)品和一個不相關(guān)產(chǎn)品,并考慮了對這些產(chǎn)品應(yīng)用五種不同選擇策略的結(jié)果。
第一種策略,即“最優(yōu)策略”,始終選擇能夠帶來更高的購買水平或參與水平的產(chǎn)品。(參與水平/購買級別是參與行為/購買行為與數(shù)據(jù)樣本中的所有交互的比率。)另外四種分別是“相關(guān)策略”,即選擇相關(guān)產(chǎn)品;“不相關(guān)策略”,即選擇不相關(guān)產(chǎn)品,“隨機策略”,即在兩種產(chǎn)品中隨機選擇,“最差策略”,即選擇會降低參與水平/購買水平的產(chǎn)品。
注:pRatio 是購買水平,eRatio 是參與度水平
從上圖的表格中可以看出,相比起通過最優(yōu)策略和相關(guān)策略選擇的商品(沒有誤差),其余策略選擇的商品在購買水平和參與水平方面都有著不小的差距。
在另一個實驗中,研究人員使用相同的 1500 個查詢來訓練三種不同的機器學習模型:一種學習最大化相關(guān)性,第二種學習最大化購買水平,第三種學習最大參與水平。在此基礎(chǔ)上,亞馬遜構(gòu)建了兩個融合模型,一個結(jié)合了關(guān)聯(lián)模型和參與模型,另一個結(jié)合了關(guān)聯(lián)模型和購買模型,而且,還可以對每個融合模型進行調(diào)優(yōu),為組成該模型的兩個模型的輸出分配不同的權(quán)重。
例如,在關(guān)聯(lián)購買融合模型中,將關(guān)聯(lián)和購買級的權(quán)值分別設(shè)置為 1 和 0,設(shè)置之后,該融合模型將只產(chǎn)生關(guān)聯(lián)模型輸出;將融合模型的權(quán)重都設(shè)置為 0.5 將會得到兩個模型輸出的均勻混合。對于這兩個融合模型,亞馬遜設(shè)置了一系列的權(quán)重并繪制了結(jié)果。
正如上圖所示,相關(guān)性和購買水平/參與水平之間存在權(quán)衡:提高或降低關(guān)聯(lián)性將會影響購買水平/參與水平的表現(xiàn)。
亞馬遜表示,如果搜索結(jié)果不能滿足客戶的需求,但看起來是相關(guān)的,客戶可能會理解并原諒這種不足。與此同時,購買水平/參與水平代表了一種更主觀的相關(guān)性類型,人工注釋員無法評估這種相關(guān)性,這也可能導致無法推薦出令人滿意的產(chǎn)品。
目前,亞馬遜用來評估相關(guān)性和購買/參與水平之間權(quán)衡的模型還相當粗糙,一個更復雜更強大的機器學習模型能夠獲得更好的結(jié)果,特別是如果它被明確地訓練來評估一些確定的因素,例如關(guān)鍵詞長度、價格和間接關(guān)系等。
雷鋒網(wǎng)了解到,在 2 月份即將舉行的 ACM Web 搜索和數(shù)據(jù)挖掘會議上,亞馬遜將進一步展示這項研究的成果。