search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

大數據背後的用戶畫像

大數據背後的用戶畫像

天火,數瀾小鮮肉產品經理,曾在互聯網電商、汽車後市場從事多年,對於電商系統和汽車領域的大數據具有深刻的見解。

1. 什麼是用戶畫像

什麼是用戶畫像呢?其實它是建立在一系列真實數據之上,抽象出來的一個標籤化的用戶模型,構建用戶畫像的核心工作就是給用戶打上一系列標籤,標籤則是通過對用戶信息進行分析挖掘出來的高度精鍊的特徵表示。就好像如果你經常購買一些玩具玩偶,電商可能就會給你打上一個「有小孩」的標籤,甚至更精準的分析出你家裡的小孩是男孩還是女孩,年齡是1到3歲,還是5到10歲,這一系列的標籤便構成了你的用戶畫像。

2. 為什麼能對用戶畫像建模

那我們為什麼能對用戶畫像做一個建模呢?可以想象一個場景:周末的早上醒來后很無聊,A便拿起手機玩NBA的遊戲,玩了10多分鐘之後,又看了DOTA的視頻直播,接著A想起來今天有事要出去一趟,就起床去洗漱,然後A化妝,穿上高跟鞋……

到現在為止大家心裡可能會有一個疑惑,就是A的性別到底是什麼?我們想的根源可能就在於描述了上面四個動作,第一個是NBA遊戲,第二個是DOTA視頻,接著是化妝以及穿上高跟鞋。一開始我們並沒有提到A的性別,而我們在潛意識裡已經開始對這個用戶進行了建模。儘管我們不知道A確切是誰,叫什麼名字。

同樣,在計算機科學領域也可以對這種行為做一次建模,以下是數據流:

△ 用戶畫像的數據流

一個用戶在網路媒介上做了一系列的行為,比如瀏覽了一些網站,下載App……這些行為都會形成數據,需要一系列的演算法為它打上一個標籤,我們要做的就是先給它打上一個標籤,也就是對它的某一些屬性做一些判斷。這裡就會有一個疑問,這個標籤和用戶真實的屬性是不是一個匹配的程度呢?這是一個很重要的問題,我們來簡單分析一下,一開始就拿最簡單的行為來分析,一開始A玩了一個NBA的遊戲,他產生了一個行為,根據這個行為,我們可能給他性別的標籤打上男性,因為他潛在的模式說明用戶某一方面的屬性與他的行為是有很強的關聯性的,也就是玩NBA的遊戲和性別是男性的關聯是非常強的(但是也有一些情況,比如喜歡攀岩這個標籤的屬性和性別的關連性就很差),所以有一些用戶的一些行為和他的某一些屬性的關聯性非常強,就有可能產生一定的可逆,而這個可逆是我們給他打標籤的基礎所在。

但是有些時候,獲得的數據特徵不像剛剛說得那麼明顯,比如想要判斷一個剛打開微信的人是男是女、多少歲顯然不可能,因為他的行為只是一個中性的標籤。如果很多中性的標籤放在一起,有可能就是某種特別的組合。比如打開QQ,又打開微信,偏低齡化的可能性就多一些。這都是我們潛在的經驗。我們通過個體的一系列數據就可以給這個個體打上比較貼切的標籤,但是很多時候用一個人的數據,匹配度會比較低,這時候可以通過一個群體的整體數據來給這個個體打上標籤。

我們在群體數據裡面,主要是要挖掘群體後面的知識,加上我們已經有的知識來對個體進行標籤的匹配,之前所說的同時打開QQ、微信可能是一個很簡單、線性的潛在模式,但是很多時候我們的數據有很多很頻繁的特徵,很頻繁的行為里就為後面隱藏了一個非線性的潛在模式數據關係。我們可以通過數據挖掘找出這種潛在模式,從而挖掘出這種個體行為與他某一種屬性的關聯度,這就是我們要通過大數據來挖掘出它背後非常重要、不易尋找的規律,這也是為什麼用戶畫像和大數據關聯度比較高。

3.確保數據的有效性

回到上面的數據鏈,從行為到數據進行建模,首先要保證真實,因為有一些數據並不是真實的,這些行為並不是用戶主動觸發的,這些行為產生的數據都是無效數據。比如某些行為是通過投廣告的行為來促使用戶完成的,那在建模中就要剔除出去的。第二就是數據到標籤這一步,要保證有效性,保證根據數據生成的標籤是有用的,也就是說有一些記錄,比如你只是打開一條微信消息的記錄,可能這個是非常沒用的,根本判斷不出任何的標籤,這部分記錄就要把它剔除掉,這樣我們就可以通過比較完美的數據進行建模。整個過程,用戶的屬性和行為的可逆性越強,數據的特徵越明顯,通過標籤的演算法,我們就可以找出標籤和用戶的屬性相匹配,就可以得到標籤和用戶匹配度非常高的準確率。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦