用戶畫像從0到100的構(gòu)建思路
掃描二維碼
隨時(shí)隨地手機(jī)看文章

導(dǎo)讀:用戶畫像作為當(dāng)下描述分析用戶、運(yùn)營營銷的重要工具,被全部互聯(lián)網(wǎng)人熟知,用戶畫像的定義并不復(fù)雜,是系統(tǒng)通過用戶自行上傳或埋點(diǎn)上報(bào)收集記錄了用戶大量信息,為便于各業(yè)務(wù)應(yīng)用,將這些信息進(jìn)行沉淀、加工和抽象,形成一個(gè)以用戶標(biāo)志為主key的標(biāo)簽樹,用于全面刻畫用戶的屬性和行為信息,這就是用戶畫像。
畫像這種結(jié)構(gòu)化的用戶信息加工方式,極大程度上做到了完整、全面且直觀地刻畫用戶。畫像是用戶在產(chǎn)品的檔案,便于人工使用、機(jī)器輸入和算法理解。簡而言之:畫像是由標(biāo)簽樹及末級(jí)標(biāo)簽的標(biāo)簽值構(gòu)成的,全面定量刻畫用戶的結(jié)構(gòu)化信息產(chǎn)品。畫像是標(biāo)簽的總成,用戶標(biāo)簽是具體刻畫用戶的結(jié)構(gòu)化信息,以下簡稱標(biāo)簽。
本文將介紹用戶畫像的構(gòu)建思路,在畫像構(gòu)建的過程中,我們把工作分為兩步:
第一步:介紹從0到1的構(gòu)建思路。
第二步:介紹從1到100的構(gòu)建思路。
1. 畫像從0到1的構(gòu)建思路
一個(gè)比較成熟的畫像系統(tǒng),會(huì)有成千上百的標(biāo)簽,這些標(biāo)簽的生產(chǎn)不是一次完成的,而是隨著業(yè)務(wù)的發(fā)展需要,逐步補(bǔ)充完善,最終呈現(xiàn)在大家眼前的就是一棵龐大的標(biāo)簽樹。
跟自然界的樹木一樣,要想長得茁壯參天,必須有一個(gè)穩(wěn)定的根基和合理的結(jié)構(gòu),用戶畫像的構(gòu)建也是一樣的,前期最重要的仍然是搭好畫像骨架,確保后續(xù)的發(fā)展過程中,依然保持清晰的結(jié)構(gòu)和高延展性。相反的,如果一開始為了搶時(shí)間,將大量標(biāo)簽無序的堆在線上,后期管理和使用的難度會(huì)迅速凸顯出來,重構(gòu)的代價(jià)巨大。
上面說到,一個(gè)好的標(biāo)簽樹結(jié)構(gòu)要滿足兩個(gè)條件,“高概括性”和“強(qiáng)延展性”,高概括性意味著結(jié)構(gòu)體系能夠很好的包含一個(gè)用戶的基本屬性和產(chǎn)品交互的相關(guān)行為,同時(shí)對(duì)于業(yè)務(wù)重點(diǎn)單獨(dú)強(qiáng)調(diào),沒有遺漏;“強(qiáng)延展性”意味著結(jié)構(gòu)全面的同時(shí)也有一定的抽象概括能力,保證新增的標(biāo)簽可以很好的找到對(duì)應(yīng)的分類,整個(gè)體系不會(huì)過于收斂局限。
按照這個(gè)原則,畫像通常從八個(gè)維度組織標(biāo)簽,分別為:基本屬性、平臺(tái)屬性、行為屬性、產(chǎn)品偏好、興趣偏好、敏感度、消費(fèi)屬性、用戶生命周期及用戶價(jià)值。
下圖所示為用戶整體架構(gòu)示例:

① 基本屬性
基本屬性是指一個(gè)用戶的基本社會(huì)屬性和變更頻率低的平臺(tái)特征,例如真實(shí)社會(huì)年齡、性別、婚姻狀況、昵稱、號(hào)碼、賬號(hào)、lbs等標(biāo)簽。這些標(biāo)簽類型多為直采型,可從用戶基本信息表中直接獲取,不需要統(tǒng)計(jì)或者算法挖掘。
示例:社會(huì)性別_女
② 平臺(tái)屬性
平臺(tái)屬性是用戶在平臺(tái)上表現(xiàn)出的基本屬性特征,是利用用戶行為進(jìn)行算法挖掘,標(biāo)識(shí)用戶真實(shí)屬性的標(biāo)簽。
最典型的平臺(tái)屬性標(biāo)簽例如平臺(tái)年齡標(biāo)簽,這里就有一個(gè)疑問,為什么在用戶的基礎(chǔ)屬性中已經(jīng)有年齡標(biāo)簽,但在平臺(tái)屬性中重復(fù)又有一個(gè)呢,這里就涉及兩者之間的差別。設(shè)想一個(gè)真實(shí)的場景:一個(gè)用戶社會(huì)身份為20歲,但他喜歡中年人的穿衣風(fēng)格,在使用app購物的時(shí)候,表現(xiàn)出的真實(shí)偏好為30-40歲,對(duì)于這樣使用產(chǎn)品時(shí)表現(xiàn)出的用戶心智和真實(shí)年齡不相符合的用戶,如果只采用上傳的基本屬性,給他推薦年輕人喜歡的物品,是不是很難命中個(gè)體用戶的興趣呢?
兩種不同的標(biāo)簽,本質(zhì)上是用戶自己上傳信息的隨意性和挖掘信息的權(quán)威性差異,是用戶社會(huì)屬性和真實(shí)屬性差異。
我們仔細(xì)分析一下兩者在數(shù)據(jù)源、計(jì)算邏輯、標(biāo)簽格式、標(biāo)簽值和應(yīng)用場景的差異,如下:
數(shù)據(jù)源與計(jì)算邏輯:基礎(chǔ)屬性是利用用戶自行上傳的存儲(chǔ)在用戶基礎(chǔ)信息表里的數(shù)據(jù),平臺(tái)屬性則利用客戶端或者服務(wù)端埋點(diǎn)上報(bào)采集的用戶行為數(shù)據(jù)進(jìn)行挖掘計(jì)算生成。基本屬性是典型的直采型標(biāo)簽,平臺(tái)屬性是典型的算法挖掘型標(biāo)簽。
末級(jí)標(biāo)簽和輸出標(biāo)簽值:以性別為例,基本屬性代表用戶真實(shí)的社會(huì)身份,是確定的事實(shí),所以典型標(biāo)簽形式為“性別_女”,而平臺(tái)屬性則代表用戶在性別維度的偏好概率,所以典型形式為“性別_女_0.80”其中‘女’為末級(jí)標(biāo)簽,0.80則代表用戶在平臺(tái)的女性身份上表現(xiàn)出的傾向程度。
應(yīng)用場景:平臺(tái)屬性通過用戶行為進(jìn)行挖掘,更能代表用戶的真實(shí)傾向,輸出結(jié)果比基本屬性準(zhǔn)確率高,在定向營銷和算法里,年齡、性別等通常采用平臺(tái)屬性。而社會(huì)屬性中電話、身份證、賬號(hào)、昵稱等使用較多。
③ 行為屬性
行為屬性記錄的是用戶的全部單點(diǎn)行為,用戶的單點(diǎn)行為包括啟動(dòng)、登錄、瀏覽、點(diǎn)擊、加車、下單等非常多,而且跟不同的產(chǎn)品,不同的模塊交互,不同的時(shí)間窗選取,行為就更加復(fù)雜了,如何能夠全面的梳理,可以按照“產(chǎn)品*功能模塊*用戶單點(diǎn)行為*時(shí)間”四大要素來組織。
這里的“產(chǎn)品*功能模塊*用戶單點(diǎn)行為*時(shí)間”意思是一個(gè)完整的行為應(yīng)該包含“哪個(gè)產(chǎn)品”“哪個(gè)功能模塊”“哪個(gè)行為”“哪些時(shí)間要求”幾要素,例如某瀏覽器體育頻道距今最近一次訪問時(shí)間。按照這幾要素組織行為,不容易發(fā)生遺漏。
示例:產(chǎn)品初次登錄時(shí)間,最后一次啟動(dòng)距今時(shí)間,30天內(nèi)搜索行為頻次,一個(gè)月內(nèi)閃屏訪問次數(shù)等。
④ 產(chǎn)品偏好
產(chǎn)品偏好是對(duì)用戶使用某些產(chǎn)品、產(chǎn)品核心功能或者其他渠道的偏好程度的刻畫,屬于挖掘型標(biāo)簽,其中產(chǎn)品的選取可以包括自家產(chǎn)品、競品;功能和渠道包括站內(nèi)產(chǎn)品功能,也包括push、短信、開屏、彈窗等幾大運(yùn)營和產(chǎn)品法寶。
示例:搜索模塊偏好、直接競品_京東偏好、短信偏好。
⑤ 興趣偏好
興趣偏好是用戶畫像內(nèi)非常重要的維度,以電商產(chǎn)品為例,用戶對(duì)商品的喜愛程度是用戶最終的信息之一,興趣偏好就是對(duì)用戶和物品之間的關(guān)系進(jìn)行深度刻畫的重要標(biāo)簽,其中最典型的要屬品牌偏好、類目偏好和標(biāo)簽偏好。
示例:品牌偏好_優(yōu)衣庫_0.91類目偏好_美妝_0.80、標(biāo)簽偏好_紅色_0.70。
⑥ 敏感度
在營銷活動(dòng)時(shí),我們留意到有些用戶不需要優(yōu)惠也會(huì)下單,而有些用戶一定要通過優(yōu)惠券刺激才會(huì)轉(zhuǎn)化,優(yōu)惠券的額度也影響了用戶下單的金額,這種情況下,如何識(shí)別對(duì)優(yōu)惠敏感的用戶發(fā)放合理的券額的優(yōu)惠券,保證優(yōu)惠券不浪費(fèi),去報(bào)促銷活動(dòng)的ROI最大,其中一個(gè)很重要的標(biāo)簽就是用戶的敏感度標(biāo)簽,敏感度代表用戶對(duì)平臺(tái)活動(dòng)或者優(yōu)惠的敏感程度,也是典型的挖掘類標(biāo)簽。
示例:熱點(diǎn)敏感度、折扣敏感度。
⑦ 消費(fèi)屬性
無論是電商、內(nèi)容或者其他領(lǐng)域,公司的目標(biāo)最終都是收益,所以消費(fèi)屬性往往作為一個(gè)單獨(dú)的維度重點(diǎn)刻畫。消費(fèi)屬性包括統(tǒng)計(jì)型標(biāo)簽——消費(fèi)頻次、消費(fèi)金額、最近一次消費(fèi)時(shí)間等,也包括挖掘型標(biāo)簽——消費(fèi)能力和消費(fèi)意愿,同時(shí)包含敏感度標(biāo)簽——優(yōu)惠促銷敏感度、活動(dòng)敏感度、新品敏感度、爆款敏感度等。
⑧ 用戶生命周期及用戶價(jià)值
用戶生命周期是用戶運(yùn)營的重要法典,一個(gè)用戶從進(jìn)入產(chǎn)品到離開,通常會(huì)經(jīng)歷“新手”“成長”“成熟”“衰退”“流失”5個(gè)典型階段,每個(gè)階段對(duì)用戶運(yùn)營存在策略差異,畫像在其中的作用是明確標(biāo)記用戶所處生命周期的階段,便于后續(xù)業(yè)務(wù)同學(xué)落地。
用戶價(jià)值是體現(xiàn)用戶為產(chǎn)品貢獻(xiàn)價(jià)值高低的標(biāo)簽,最經(jīng)典的是RFM模型獲得交易維度標(biāo)簽,與此同時(shí),也應(yīng)該看到用戶的其它價(jià)值,例如為產(chǎn)品貢獻(xiàn)活躍度,通過裂變拉來新用戶,這些都可設(shè)計(jì)相應(yīng)的標(biāo)簽。
示例:新手、成長、成熟、衰退、流失、高價(jià)值用戶、VIP等級(jí)等。
2. 畫像從1到100的構(gòu)建思路
在前面一節(jié),我們討論了一個(gè)用戶畫像的基礎(chǔ)框架應(yīng)該如何搭建,這一節(jié)討論一下,有了基礎(chǔ)框架,到底應(yīng)該如何著手一步一步完善畫像標(biāo)簽樹,如何從一個(gè)基于業(yè)務(wù)的需求落地為標(biāo)簽的設(shè)計(jì),如何將標(biāo)簽應(yīng)用到具體的業(yè)務(wù)中。
要解決“如何做”“如何用”兩大問題,要從這個(gè)問題的根本入手思考,也就是我們?yōu)槭裁匆鲇脩舢嬒瘢脩舢嬒竦淖饔檬鞘裁?,了解了這個(gè)問題,便能水到渠成的根據(jù)用途合理的設(shè)計(jì)方案。
用戶畫像的主要目的有三個(gè),具體如下:
第一用于用戶信息的統(tǒng)計(jì),建立對(duì)產(chǎn)品對(duì)用戶的基本認(rèn)知;第二用于用戶定向營銷,利用人群圈選投放物料;第三用于算法,沉淀用戶特征,供模型使用。所以標(biāo)簽的完善也可以按照這三個(gè)維度不斷豐富,以下分別舉例說明標(biāo)簽建設(shè)的思路。
① 用于統(tǒng)計(jì),對(duì)產(chǎn)品對(duì)用戶的基本認(rèn)知
每個(gè)產(chǎn)品功能策略完善,都需要建立在對(duì)產(chǎn)品對(duì)用戶的充分認(rèn)知基礎(chǔ)上,也就是說,用戶是誰,有何特點(diǎn),基本情況如何,這些是用戶畫像需要回答的重要問題。
思路拆解:既然要了解用戶的基礎(chǔ)信息,就需要將用戶基本屬性進(jìn)行拆解:年齡、性別、居住城市(幾線)、家庭結(jié)構(gòu)(婚否、孩否)等。為了盈利考慮,還需要了解基本的收入水平、消費(fèi)能力等。將拆解的維度抽象,構(gòu)建對(duì)應(yīng)標(biāo)簽,然后進(jìn)行分布統(tǒng)計(jì),便能生成一份基本的用戶認(rèn)知報(bào)告。
標(biāo)簽結(jié)果:年齡、性別等。
② 用于定向營銷和精細(xì)化運(yùn)營
運(yùn)營同學(xué)作為畫像的重要業(yè)務(wù)使用方,每天都會(huì)通過標(biāo)簽圈選人群,做定向的用戶、活動(dòng)、內(nèi)容精細(xì)化運(yùn)營,以及各app每天都在進(jìn)行的促銷活動(dòng)。這些運(yùn)營和活動(dòng)的場景分布在產(chǎn)品的各個(gè)渠道和各個(gè)資源位,對(duì)場景和人群的驚喜程度要求都很高。
我們舉例一個(gè)日常工作中最常見的需求:通過一次數(shù)據(jù)分析發(fā)現(xiàn),產(chǎn)品的流失用戶占比提升,通過討論,大家認(rèn)為通過一次結(jié)合利益點(diǎn)的push推送,召回流失用戶,是有效且快速的手段,同時(shí)push作為各個(gè)業(yè)務(wù)都在爭取的有限資源,希望可以提高使用效率,確保push這個(gè)資源渠道的整體ROI,以上需求希望畫像可以支持。
思路拆解:從這個(gè)需求背景中,我們做一次關(guān)鍵詞提取,不難發(fā)現(xiàn),關(guān)鍵詞如下是“流失用戶”、“利益點(diǎn)”、“push”“效率”。其中流失用戶是用戶身分識(shí)別,利益點(diǎn)是用戶優(yōu)惠敏感度,push是產(chǎn)品渠道資源,效率意味著要盡可能的確保全選人群精準(zhǔn),不能為了覆蓋率犧牲準(zhǔn)確率。
思路拆解完畢,具體落地就變得簡單多了,參考步驟如下:
第一步:需要流失用戶的口徑和標(biāo)簽,這里需要用到用戶生命周期的劃分,從中識(shí)別并標(biāo)識(shí)出流失用戶。
第二步:分析對(duì)流失用戶拉回效果最好的利益點(diǎn),例如優(yōu)惠券、折扣、禮品或者是其他內(nèi)容。這一步需要運(yùn)營和數(shù)據(jù)同學(xué)根據(jù)日常經(jīng)驗(yàn)和數(shù)據(jù)分析獲得,對(duì)于畫像的要求是基于分析結(jié)論,挖掘不同用戶對(duì)于優(yōu)惠折扣的敏感程度,這一部分在標(biāo)簽架構(gòu)敏感度部分有論述,最終目的是確保每一分錢都能花在刀刃上。
第三步:確定拉回的明確目標(biāo),是拉回規(guī)模還是準(zhǔn)確率,通過需求分析可以確定,本次拉回在資源有限的情況下,需要提升人群識(shí)別的準(zhǔn)確率,畫像實(shí)現(xiàn)準(zhǔn)確率的方法有兩條路徑,一是提升畫像算法的準(zhǔn)確率,這部分主要依賴算法本身,無法一蹴而就,所以這里選擇的方法是增加人群全選的條件,可就是新增標(biāo)簽,供圈選求交
根據(jù)背景分析,我們可以增加流失用戶關(guān)于push渠道的打開意愿的標(biāo)簽,提高push資源的使用效率。
經(jīng)過上述分析,需要生產(chǎn)的標(biāo)簽如下:
用戶生命周期_流失。
用戶折扣優(yōu)惠敏感度。
push使用標(biāo)簽:這里可用統(tǒng)計(jì)型標(biāo)簽,例如push最近一次訪問時(shí)間,在使用時(shí)設(shè)置條件為“最近3天,最近7天”;也可用綜合的算法挖掘型標(biāo)簽,即push渠道偏好。
通過以上需求分析和思路拆解,畫像的建設(shè)過程應(yīng)該比較明確,這里再留一個(gè)思考的case,可以嘗試如何分析如何落地:平臺(tái)新上一款商品,初期需要在某模塊展示給目標(biāo)用戶做推廣,同時(shí)盡量不打擾其他非目標(biāo)用戶,不降低該資源位的整體轉(zhuǎn)化效率。
思路拆解提示:商品的目標(biāo)用戶——商品可以按照哪些維度拆分關(guān)鍵信息?模塊位置——用戶的模塊功能使用偏好是什么?準(zhǔn)確率的要求——如何提升畫像應(yīng)用的準(zhǔn)確率?
回答好以上問題,這個(gè)需求的標(biāo)簽便能順利獲得。
③ 用于算法,主要應(yīng)用于搜索推薦、風(fēng)控廣告等策略方向,標(biāo)簽可以直接作為用戶特征使用
標(biāo)簽除了用于基本的用戶群體描述,定向營銷和精細(xì)化運(yùn)營,還有一個(gè)相對(duì)來說新穎又廣泛的用途,用于各算法的各個(gè)環(huán)節(jié),在召回和排序兩大經(jīng)典策略流程中,都可以用到用戶畫像,這里我們舉例畫像在推薦系統(tǒng)的召回層應(yīng)用案例。
需求背景:推薦系統(tǒng)的本質(zhì)是從海量信息中計(jì)算用戶最感興趣的部分,對(duì)應(yīng)推薦系統(tǒng)的“召回-粗排-精排”,是一個(gè)“層層精選”的過程。其中召回層是精選的第一道流程,為后續(xù)計(jì)算打分準(zhǔn)備初步的興趣候選集,這里候選集的生成方法之一就是用戶畫像法。仍然以電商業(yè)務(wù)為例,講述如何用用戶畫像做興趣召回。
思路拆解:召回的作用是粗篩,幫助推薦系統(tǒng)計(jì)算第一道用戶興趣池,這里用戶對(duì)物品的興趣興趣可拆解為對(duì)商品品牌、類目和商品標(biāo)簽的興趣,這部分就已經(jīng)轉(zhuǎn)化為上述文章中的已知內(nèi)容,用戶標(biāo)簽中是有品牌偏好標(biāo)簽、類目偏好標(biāo)簽和標(biāo)簽偏好標(biāo)簽的,只需要在所有品牌、類目、標(biāo)簽下維護(hù)一個(gè)按照商品質(zhì)量或者熱度倒敘的列表,這樣只要獲取到用戶標(biāo)識(shí),邊能從用戶畫像中獲取偏好的品牌、類目和標(biāo)簽,再從品牌、類目和標(biāo)簽下的商品列表中召回相應(yīng)的商品,根據(jù)候選集大小的設(shè)計(jì),做top k截?cái)嗾倩?。這部分商品完成了初步的召回,為進(jìn)入下一個(gè)流程進(jìn)行粗排和精排做準(zhǔn)備。
以上章節(jié),選自:《數(shù)據(jù)產(chǎn)品經(jīng)理:實(shí)戰(zhàn)進(jìn)階》
特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:
長按訂閱更多精彩▼
如有收獲,點(diǎn)個(gè)在看,誠摯感謝
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請(qǐng)聯(lián)系我們,謝謝!