愛奇藝效果廣告的個性化探索與實踐
掃描二維碼
隨時隨地手機看文章

導讀:隨著大數(shù)據(jù)和人工智能的技術(shù)進步,數(shù)字營銷行業(yè)也在不斷變化。得益于雄厚技術(shù)實力,愛奇藝效果廣告得到蓬勃發(fā)展,實現(xiàn)了海量觸達、定向精準、效果顯著的廣告投放,為廣告主提供跨平臺、多終端的網(wǎng)絡(luò)推廣服務(wù)。本次我將分享愛奇藝效果廣告?zhèn)€性化方面的思考與實踐,聚焦廣告排序算法,希望能為大家?guī)硪恍﹩l(fā)。
包括以下三部分:
愛奇藝效果廣告算法 - 背景&架構(gòu)
點擊&轉(zhuǎn)化率預估 - 核心問題
智能出價 - 博弈&共贏
▌愛奇藝效果廣告算法-背景&架構(gòu)
1. 廣告資源位
如上圖所示,愛奇藝主要的資源位可以用雙引擎來概括,即信息流和框內(nèi):
信息流:信息流廣告位由準信息流和純信息流共同構(gòu)成的。其中,打開 App 顯示的推薦頁,由于是非原生信息,但是以信息流形式推送,所以我們稱之為準信息流廣告位。同時,愛奇藝平臺提供了很多原生頻道,比如熱點頻道,在這些頻道下插入的廣告稱為純信息流。
框內(nèi):對于框內(nèi)資源,效果廣告主要投放在框內(nèi)中插的位置上,同時也會做一些前貼和后貼的框內(nèi)廣告投放。
其他:除上述兩大引擎,還有猜你喜歡和視頻關(guān)聯(lián)位等資源位。
2. 計費方式
oCPX ( optimized CPX ) 業(yè)務(wù)是 oCPC ( optimized Cost Per Click ) 和 oCPM ( optimized Cost Per Mille ) 兩種計費方式的統(tǒng)稱,是從 CPX 業(yè)務(wù)演進而來,這里的 CPX 代表的是以點擊計費和真實觀看計費。
CPX 時代廣告主投放廣告是以點擊作為計費方式,但廣告主的真實訴求是點擊后的轉(zhuǎn)化行為。例如上圖,一個 App 的廣告,用戶點擊后的下載、安裝、付費,這些轉(zhuǎn)化行為才是廣告主真正關(guān)注的。廣告主為了提升從點擊到轉(zhuǎn)化的概率,會做很多離線優(yōu)化,例如定向20-30歲女性或定向喜歡《親愛的熱愛的》電視劇的用戶。但這樣做可能會產(chǎn)生很多問題,比如定向粒度過細,目標人群少,導致廣告放量效果不佳。
為解決上述問題,oCPX 的業(yè)務(wù)誕生了,優(yōu)化目標從點擊變成了后續(xù)的轉(zhuǎn)化行為,廣告主只需在投放廣告時設(shè)置轉(zhuǎn)化目標以及這個目標下的出價,其他的事情由算法模型來解決。
3. 算法難點
oCPX 業(yè)務(wù)對算法挑戰(zhàn)難題主要為上圖三點:
轉(zhuǎn)化樣本非常高維稀疏,樣本維度高且正樣本量極少。
oCPX 業(yè)務(wù)復雜,比如需要支持安裝轉(zhuǎn)化、付費轉(zhuǎn)化、關(guān)注公眾號轉(zhuǎn)化等類型。
平臺流量大,對計算規(guī)模時效要求高。
4. 個性化廣告推薦流程
召回:對候選廣告進行召回,比如人群定向等。
粗排:使用輕量級但保證精度的模型對廣告做初選,避免精排階段服務(wù)壓力過大。粗排階段還有冷啟動和隨機探索等功能模塊,主要用于解決 E&E 問題,避免馬太效應(yīng) ( 投放好廣告越來越好,差的越來越差 )
精排:使用高精度模型對點擊率、轉(zhuǎn)化率和智能出價進行預估。另外精排階段還支持預算平滑功能。還有預算平攤到全時段等。
5. 排序邏輯
粗、精排的排序邏輯依照 eCPM ( effective Cost Per Mille ),也就是千次展示平臺的預期收益來排序,其計算公式如上圖所示,eCPM=點擊率×轉(zhuǎn)化率×出價×智能出價因子。
6. 線上訓練推理流程
如上圖自下而上:
1. 現(xiàn)場特征,相較離線特征,現(xiàn)場特征能真實還原線上環(huán)境。
2. 第二步進入模型訓練,會有 FM 分天模型、FM 在線學習、深度學習和強化學習等。
3. 完成模型離線訓練后推送至線上,結(jié)合離線、實時特征進行在線推理。
▌點擊&轉(zhuǎn)化率預估-核心問題
1. 特征工程
從周期來劃分特征可分為實時、短期和長期。
實時特征主要考慮場景特征,即上下文特征,比如用戶在看到廣告之前看了哪些視頻;時間信息也是非常重要的實時特征,比如周末和工作日分時段的點擊轉(zhuǎn)化率表現(xiàn)就有很大差異;此外還有反饋特征,包括正反饋及負反饋,主要針對用戶看過哪些行業(yè)的廣告及后續(xù)轉(zhuǎn)化行為。
短期特征包含用戶觀影興趣、搜索行為、社交行為和商業(yè)興趣等。其中短期觀影興趣可能會發(fā)生變化,比如上圖,如果有位女性用戶懷孕了,她的觀影興趣可能會從長期的仙俠類視頻短期切換到母嬰類視頻。
長期特征有人口基礎(chǔ)屬性(性別年齡等)、觀影興趣、商業(yè)興趣、廣告基礎(chǔ)屬性(所處行業(yè)等)和素材質(zhì)量等。這里的觀影興趣,依然舉上圖例子,這位女性用戶可能喜歡參與仙俠類的討論,喜歡出現(xiàn)在仙俠劇中的偶像等等,所以針對這位用戶打得長期觀影興趣的標簽是仙俠。
2. 在線學習
天下武功唯快不破,時效性對模型來說是非常重要的。當前線上使用的基于 FTRL 的 FM 模型,實時消費線上 Kafka 流的數(shù)據(jù),分鐘級進行模型更新。由于線上模型是分鐘級更新,線上要有一套監(jiān)控體系,一旦線上指標出現(xiàn)異動,比如上圖舉例的 AUC 低于離線分天訓練的備用的模型,會進行線上模型與備用離線模型自動切換。
3. 深度學習
為了提高模型準確率和泛化能力,上線了深度學習,當前采用的是 Wide&Deep 的模型,并進行了離線模型調(diào)優(yōu)和線上性能優(yōu)化,以滿足廣告場景下對高 QPS 以及高穩(wěn)定性需求。
4. 高維稀疏
在轉(zhuǎn)化率預估場景下,會遇到數(shù)據(jù)高維稀疏問題。舉個例子,在做偏差校準的時候,會出現(xiàn)很多分桶里面一個正樣本都沒有,進而導致這些分桶最終的預估轉(zhuǎn)化率結(jié)果為零。為解決這個問題,采用的方法是動態(tài)分桶大小,根據(jù)當前廣告下歷史正樣本數(shù)量,動態(tài)決定分桶寬度以及分布。
同時,轉(zhuǎn)化率預估場景有滯后性問題,例如以 APP 作為推廣目標的廣告主設(shè)置轉(zhuǎn)化目標為付費,但從用戶點擊廣告到最終付費可能會經(jīng)歷很長的時間。傳統(tǒng)的做法是設(shè)立時間窗口對這條樣本進行跟蹤,窗口內(nèi)完成轉(zhuǎn)化目標即打上正樣本標簽,反之則當作負樣本看待,但很明顯這么做有很多問題。為解決這個問題采用了一種替代方案,當點擊產(chǎn)生時,我們將樣本當作負樣本來看,當轉(zhuǎn)化行為完成后,這個樣本就視為正樣本,當然這里會進行適當?shù)臋?quán)重調(diào)整。
此外,還有轉(zhuǎn)化率階躍的問題,即轉(zhuǎn)化數(shù)據(jù)集中到來,正樣本突然增多,轉(zhuǎn)化率預估可能從萬分之幾直接到百分之幾。這樣就會造成轉(zhuǎn)化數(shù)據(jù)到來前廣告放量不足,到來后爆量問題。為了解決這個問題引入非目標的轉(zhuǎn)化數(shù)據(jù)作為正樣本使用,比如轉(zhuǎn)化目標是付費,我們可以引入下載、激活等也作為加權(quán)降權(quán)后的正樣本來消費。
▌智能出價-博弈&共贏
1. 成本控制
智能出價的基本功能是進行成本控制,保證廣告的實際成本在目標成本附近。并在此基礎(chǔ)上盡可能多拓量。所以這里存在成本和放量的博弈。所使用的方法是在 eCPM 上乘一個智能出價因子,這個因子是實際成本與目標成本的函數(shù)輸出,比如上圖實際成本大于目標成本時,因子小于1,用更廉價的流量來拉低成本,反之大于1,提高競爭能力獲取更多流量。
2. 流量優(yōu)選
上面介紹了基礎(chǔ)版本的智能出價方案,但這樣會產(chǎn)生一些問題,比如放量過程中的訂單,可能以高價格獲得了低質(zhì)的流量而導致效果不佳,反之可能錯過高質(zhì)量流量。解決方法是做流量粒度下的智能出價 ,即考慮成本的同時也考慮流量質(zhì)量,就是上圖g函數(shù),考慮成本參數(shù)的同時也加入流量質(zhì)量參數(shù)。
特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:
長按訂閱更多精彩▼
如有收獲,點個在看,誠摯感謝
免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!