DSP核心算法和數(shù)據(jù)價(jià)值的應(yīng)用
隨著程序化購(gòu)買(mǎi)規(guī)模的快速增長(zhǎng),DSP已經(jīng)從概念化階段發(fā)展成為具有規(guī)范化考核目標(biāo)的市場(chǎng)標(biāo)配產(chǎn)品服務(wù)。然而,目前的DSP市場(chǎng)魚(yú)龍混雜,在各家DSP都可以標(biāo)準(zhǔn)化對(duì)接流量交易平臺(tái)(Exchange),進(jìn)行廣告投放的情況下,算法和數(shù)據(jù)即成為DSP最核心的競(jìng)爭(zhēng)力,它們從本質(zhì)上構(gòu)成了在相同資源約束下DSP達(dá)成更優(yōu)KPI的邏輯支撐點(diǎn)。
事實(shí)上,算法和數(shù)據(jù)是DSP看不到的底層結(jié)構(gòu),它們的價(jià)值主要體現(xiàn)在三個(gè)方面:一是為廣告主精準(zhǔn)識(shí)別和觸達(dá)用戶,二是需要對(duì)用戶的價(jià)值進(jìn)行準(zhǔn)確的預(yù)估,三是按其需求認(rèn)知階段選擇好打動(dòng)TA的營(yíng)銷信息。解決了這三個(gè)問(wèn)題,就能讓廣告預(yù)算進(jìn)行合理分配,從而達(dá)到優(yōu)化廣告投放的效果。
算法和數(shù)據(jù)的場(chǎng)景應(yīng)用
通常,DSP中算法和數(shù)據(jù)發(fā)揮效力主要體現(xiàn)在一下幾個(gè)場(chǎng)景:
首先,要在浩瀚的互聯(lián)網(wǎng)資源市場(chǎng)中找到目標(biāo)用戶(TA)。以母嬰行業(yè)為例,營(yíng)銷過(guò)程中有兩個(gè)難點(diǎn)待解決,一是用可信邏輯確認(rèn)你找到的“母嬰”用戶的確是“母嬰”人群,二是“母嬰”人群在不同渠道不同媒介之間的統(tǒng)一識(shí)別能力。理想情況下,每個(gè)標(biāo)簽人群集是DSP算法根據(jù)用戶的互聯(lián)網(wǎng)行為建立模型,然后通過(guò)可信Panel庫(kù)進(jìn)行驗(yàn)證迭代優(yōu)化模型的持續(xù)過(guò)程。所以DSP基于完整的用戶行為和可信panel庫(kù),建立可信的需求判斷模型,是構(gòu)建“可信”標(biāo)簽用戶關(guān)鍵點(diǎn)。
最實(shí)用的Panel庫(kù)就是客戶的第一方數(shù)據(jù),包括線下會(huì)員信息或線上廣告投放的收集到的轉(zhuǎn)化信息(理論上客戶在各電商平臺(tái)的購(gòu)買(mǎi)用戶群均應(yīng)該為自身資產(chǎn))。例如,YOYI標(biāo)簽體系中分為興趣標(biāo)簽和購(gòu)買(mǎi)意向兩種不同需求層級(jí)的受眾,對(duì)應(yīng)地,我們會(huì)參考用戶在官網(wǎng)行為特征,判定出用戶的不同需求層級(jí),以此作為建模檢驗(yàn)標(biāo)準(zhǔn)之一。
同時(shí),YOYI一方面接入了國(guó)內(nèi)市場(chǎng)上幾乎全部交易平臺(tái)和主流媒體的流量,大面積覆蓋用戶互聯(lián)網(wǎng)行為;另一方面,我們?nèi)诤嫌脩舻淖匀恍袨楹蛷V告行為,從用戶角度來(lái)分析,只要發(fā)生實(shí)際的瀏覽和點(diǎn)擊行為,就是用戶對(duì)信息感興趣的一種體現(xiàn),并不嚴(yán)格區(qū)分信息是自然信息還是廣告信息。以上兩點(diǎn)讓YOYI能夠全面還原用戶的互聯(lián)網(wǎng)行為軌跡。
完整用戶行為軌跡保證模型可用特征完備、特征取值準(zhǔn)確;豐富的第一方Panel數(shù)據(jù),為模型訓(xùn)練提供真實(shí)有效的訓(xùn)練和驗(yàn)證集合,這兩點(diǎn)共同保證了用戶判斷模型的有效性。實(shí)際操作中,根據(jù)用戶行為的所在場(chǎng)景、媒介、時(shí)間、頻次、瀏覽時(shí)長(zhǎng)、搜索、點(diǎn)擊廣告、瀏覽廣告等所有行為進(jìn)行特征分類和特征抽取,訓(xùn)練用戶需求階段性行為模型,以進(jìn)行標(biāo)簽建模。這樣我們能對(duì)用戶的需求和需求層級(jí)做出更為準(zhǔn)確的判斷。
同時(shí),對(duì)目標(biāo)用戶進(jìn)行多渠道統(tǒng)一識(shí)別是技術(shù)需要解決的另一個(gè)問(wèn)題,目前有機(jī)會(huì)大規(guī)模完成互聯(lián)網(wǎng)PC和移動(dòng)端統(tǒng)一ID識(shí)別的只有同時(shí)擁有大體量移動(dòng)和PC用戶的巨頭公司,讓DSP可以較容易地跨越這個(gè)問(wèn)題。但是在國(guó)內(nèi)目前尚未有大體量的統(tǒng)一跨屏ID標(biāo)準(zhǔn)化服務(wù),所以需要DSP構(gòu)建自己的多屏統(tǒng)一ID體系。YOYI的做法是自己構(gòu)建跨屏用戶識(shí)別算法,再以市場(chǎng)上比較標(biāo)準(zhǔn)的第三方跨屏ID作為訓(xùn)練集進(jìn)行優(yōu)化驗(yàn)證。例如,同一個(gè)人在PC和移動(dòng)上,wifi接入、地理位置、行為軌跡、觸媒習(xí)慣都會(huì)有一些相似性,這些是構(gòu)建統(tǒng)一ID算法的基礎(chǔ)。大規(guī)模數(shù)據(jù)的機(jī)器學(xué)習(xí)算法和人工規(guī)則結(jié)合起來(lái),可以從很多維度去解構(gòu)數(shù)據(jù)和認(rèn)識(shí)數(shù)據(jù),從而解決規(guī)律不明顯和行為不連貫的問(wèn)題。對(duì)用戶在PC、移動(dòng)、以及PC和移動(dòng)的交叉維度進(jìn)行特征抽取和建模,訓(xùn)練出統(tǒng)一ID模型,以標(biāo)準(zhǔn)第三方的跨屏ID作為評(píng)測(cè)標(biāo)準(zhǔn),準(zhǔn)確率達(dá)到了可用的程度。
其次,要分析目標(biāo)用戶的價(jià)值強(qiáng)弱,并不是每個(gè)絕對(duì)準(zhǔn)確的“母嬰”人群在每個(gè)場(chǎng)景下遇到時(shí)都“正好”急于購(gòu)買(mǎi)奶粉。用戶級(jí)別的轉(zhuǎn)化率預(yù)估和點(diǎn)擊率預(yù)估問(wèn)題,是效果廣告的關(guān)鍵問(wèn)題。預(yù)估特定廣告在特定位置特定用戶下的點(diǎn)擊率和轉(zhuǎn)化率是一個(gè)典型的大規(guī)模數(shù)據(jù)的機(jī)器學(xué)習(xí)問(wèn)題。我們構(gòu)建了用戶特征體系、廣告反饋特征體系、流量特征體系,以及各個(gè)維度的交叉特征體系,用經(jīng)典LR作為預(yù)估模型,GBDT作為高維特征抽取模型,進(jìn)行了點(diǎn)擊率預(yù)估和轉(zhuǎn)化率預(yù)估,離線評(píng)測(cè)和在線效果都有不錯(cuò)的表現(xiàn)。預(yù)估了點(diǎn)擊率和轉(zhuǎn)化率以后,根據(jù)營(yíng)銷目標(biāo),我們就可以就行KPI為導(dǎo)向的CPM計(jì)算了。以汽車Leads為例,Ecpm=CPA*轉(zhuǎn)化率,根據(jù)不同用戶和不同流量進(jìn)行CPM的出價(jià),以達(dá)到在有限預(yù)算內(nèi),效果最好。
此外,還有一個(gè)常常被忽略但至關(guān)重要的策略是防作弊能力,如何對(duì)輸入模型的數(shù)據(jù)進(jìn)行有效性識(shí)別,排除虛假流量、點(diǎn)擊,甚至轉(zhuǎn)化,是需要單獨(dú)文章專門(mén)展開(kāi)的一個(gè)核心課題,這里先做記錄,以提示其重要性。進(jìn)行數(shù)據(jù)提純后的轉(zhuǎn)化率至關(guān)重要,一方面是投放中進(jìn)行廣告篩選排序的重要因子,決定了給用戶在當(dāng)前場(chǎng)景下看到的最相關(guān)廣告是哪個(gè),另一方面,在廣告主授權(quán)情況下,算法可以針對(duì)目標(biāo)用戶進(jìn)行自動(dòng)競(jìng)價(jià),以保證適當(dāng)范圍跳出CPA的出價(jià)限制去追蹤核心用戶群,避免被競(jìng)爭(zhēng)對(duì)手“搶去”展現(xiàn)機(jī)會(huì)。
最后,找到了人,知道了TA所在場(chǎng)景下的關(guān)注點(diǎn)及對(duì)應(yīng)的需求階段,就要考慮用合適的溝通方式去打動(dòng)TA。目前受限于目前廣告主創(chuàng)意的豐富度、制作能力和媒體審核周期的限制,我們?cè)谥悄軇?chuàng)意上的算法應(yīng)用還在發(fā)展初期,創(chuàng)意組合效用的爆發(fā)還有很大空間。不過(guò)已經(jīng)看到市場(chǎng)上已經(jīng)有一些第三方創(chuàng)意公司在這個(gè)方向上努力推進(jìn),一場(chǎng)互聯(lián)網(wǎng)廣告的創(chuàng)意革命指日可待。
算法和數(shù)據(jù)的行業(yè)定制化應(yīng)用
以汽車行業(yè)的算法和數(shù)據(jù)應(yīng)用為例,來(lái)說(shuō)明下通用算法和數(shù)據(jù)框架需要通過(guò)行業(yè)定制化優(yōu)化才可以發(fā)揮最佳效力。在汽車實(shí)際廣告投放中,我們發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象:用戶汽車相關(guān)行為的時(shí)間維度是對(duì)最后銷售Leads非常有用的一個(gè)特征。我們分析,有些汽車愛(ài)好人群,雖然長(zhǎng)期關(guān)注汽車論壇或者瀏覽汽車知識(shí),但是他們短期內(nèi)沒(méi)有購(gòu)車需求,所以對(duì)于銷售Leads并沒(méi)有太多作用。但是對(duì)于短期內(nèi)有購(gòu)車需求的人,他們的行為時(shí)效性會(huì)非常明顯。所以我們?cè)谕ㄓ媚P突A(chǔ)上對(duì)重點(diǎn)行業(yè)的建模因子進(jìn)行了差異化處理,讓一些行業(yè)中特定的顯性特征在用戶需求識(shí)別中發(fā)揮獨(dú)特效力,成為滿足廣告主不同營(yíng)銷目標(biāo)的有效武器。
總結(jié)下,DSP中算法和數(shù)據(jù)核心應(yīng)用就三個(gè)方面,一個(gè)對(duì)用戶各種興趣不同階段的識(shí)別,一個(gè)對(duì)用戶在不同媒介場(chǎng)景下價(jià)值的判定,一個(gè)是對(duì)用戶展示有效信息的選擇。圍繞這些問(wèn)題,用戶興趣和效果價(jià)值算法體系構(gòu)成了YOYI的核心算法體系,在實(shí)踐中不斷改善,幫助廣告主完成營(yíng)銷目標(biāo)。[!--empirenews.page--]