search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

大數據時代的用戶行為研究

隨著大數據行業的飛速發展,未來5-10年將是大數據產業的黃金增長期。2017年3月21日成立了首個聚焦數據流動的國家級實驗室——大數據流通與交易國家工程實驗室。2017年國內大數據技術和服務市場的複合年增長率預計將達27%,市場規模約320億美元。設備指紋技術實現了對用戶移動設備的精準識別,結合大數據用戶研究,使得大數據在精準營銷、智能推薦等諸多領域能夠完美定位目標用戶,實現信息的精準觸達。大數據用戶研究,不僅僅需要洞察用戶特徵、用戶偏好,還需要評估用戶間的關聯度,建立用戶社交網路。只有對用戶全方位的洞察,才能提高定位目標用戶的精度,提供大數據應用質量。

研究背景

極光大數據擁有海量的用戶行為數據,能夠為企業提供全行業諸多領域的綜合解決方案。目前基於自有的大數據平台,極光大數據在精準營銷、數字化運營、智能推薦等領域取得了豐碩的成果。而極光大數據在這些領域的成就,完全取決於極光高效率的大數據平台、豐富的數據資源、海量跨行業用戶標籤、以及經驗豐富的團隊。

目前大數據行業中對於用戶的研究大多數集中於用戶標籤開發階段。而極光大數據為了提升自己數據產品的質量和實力,在精準營銷和智能推薦的實際案例中不僅使用了海量的客戶標籤,還將基於設備的用戶相似性引入模型,以提高目標用戶識別精度和廣度,實際運用中也取得了非常好的效果。此外設備相似性為兩兩之間的相似性,對於較大用戶體量的極光大數據來說,整個模型處理計算量非常龐大,性能和精度也是我們不斷優化的關鍵點。

極光大數據研究方案

本文重點介紹基於極光海量數據,計算基於用戶在移動互聯網行為特徵的用戶行為相似性,以及基於用戶線下地理位置軌跡的空間軌跡相似度。

1、 一人多機檢測

極光大數據通過自有業務海量調用日誌分析,對於用戶設備及app建立了多維度的唯一性識別標識,通過設備的多維度識別交叉定位,發掘設備關聯關係。

2、 用戶行為相似性

極光大數據通過移動設備的用戶行為相似性來衡量用戶在移動設備上的使用行為相關程度,主要從2個方面來度量:

  • app安裝特徵相似度:

基於極光大數據平台的海量數據挖掘,構造用戶app安裝行為特徵矩陣,使用廣義Jaccard相關係數,計算用戶app安裝特徵相似度。對於用戶app安裝特徵,不同的app能夠反映用戶相似度的程度有很大差異,根據app的滲透率加權得到修正後的app安裝特徵相似度。

  • WiFi特徵關聯度:

基於極光大數據平台的海量數據,根據時間、空間、無線WiFi屬性等信息進行清洗加工,建立用戶WiFi使用特徵矩陣;基於用戶WiFi特徵矩陣,對於不同時段設備間的WiFi特徵,採用餘弦相似度計算兩兩用戶間的工作日WiFi使用特徵關聯度和周末WiFi使用特徵關聯度。

3、空間軌跡相似度

空間軌跡相似度(spatial trajectory similarity)演算法的基本思想就是通過降維的手段將多維空間向量分解到同一維度上求解,通過解決平面問題來達到最終解決空間模型的目的。

兩個軌跡間的相似度可以定義為:Sim(A,B) = (POIA∩POIB)/ (POIA∪POIB);

向量空間餘弦相似度(Cosine Similarity):餘弦相似度用向量空間中兩個向量夾角的餘弦值作為衡量兩個個體間差異的大小。餘弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似。

提取一段時間內的用戶報點信息,按照時間序列處理,採用STS演算法,計算兩兩設備間的空間軌跡相似度。

實證效果

1、app安裝特徵相似度:

對於某用戶換機前後的兩個設備,計算app安裝特徵相似度,使用app滲透率加權,兩個移動設備的app安裝特徵相似度為:0.913,app安裝特徵相似性非常高。

兩個設備安裝app數量為120個以上,app安裝重合度為72.8%,同時安裝了滲透率低於5%的app應用有22個,滲透率低於1%的app有7個。由此可見,app的安裝情況能在一定程度上反應設備之間的相似性。

2、 WiFi使用特徵關聯度:

基於兩個設備的WiFi使用偏好情況,計算WiFi特徵關聯度,計算得出工作日WiFi使用特徵關聯度為0.35,周末WiFi使用特徵關聯度為0;

經過極光大量數據驗證,工作日WiFi特徵關聯度大於0.25,為工作日關係較為密切的用戶,比如同事關係;周末WiFi特徵關聯度大於50%,為周末關係較為密切的用戶,比如親人。

3、空間軌跡相似度

從極光大數據資料庫中挑選3個空間軌跡較為相似的設備,其中設備A和設備C為同一用戶的兩個設備,設備A和設備B的位置軌跡比較相近,以設備A為基準,分別計算設備A和設備B、設備A和設備C的空間軌跡相似度。

上表中都是解析出的各軌跡對應的POI坐標值,按時間維度將三維空間軌跡解析到平面中,分別取各POI點的經度(id,lat)和維度(id,lng)計算軌跡間的餘弦相似度。二者的平面軌跡圖如下(紅線表示設備A,藍實線表示設備B,虛線表示設備C):

可以計算出COSlat(A,B)= 0.708, COSlng(A,B)= 0.784; COSlat(A,C)= 0.746, COSlng(A,C)= 0.819;

那麼可以得到該設備A與設備B的相似度為0.746,與設備C的相似度為0.783。顯然設備A和設備C的空間相似度較高。

總結

目前各個行業的大數據的應用越來越頻繁,大數據精準營銷、大數據運營、智能推薦等應用均取得顯著的效果,而這些領域都要求企業對用戶要有充分的了解,才能精準的定位目標人群。如何有效高質量的擴充目標群體用戶,基於現有用戶標籤的基礎上,用戶相似性也是一個非常重要的信息。極光大數據基於設備的用戶相似性能夠在精準營銷、智能推薦中發現很多的關聯用戶,能夠一定程度上擴充關聯目標人群,提升企業的營銷效率和質量。

點擊關鍵詞,獲取興趣內容

關於極光

極光(www.jiguang.cn)是領先的移動大數據服務商。其團隊核心成員來自騰訊、摩根士丹利、豆瓣、Teradata和移動等公司。公司自2011年成立以來專註於為app開發者提供穩定高效的消息推送、統計分析、即時通訊和簡訊等開發者服務。至今我們已經服務了超過50萬款移動應用,累計覆蓋超過70億個移動終端,月獨立活躍設備超過7億,產品覆蓋了國內90%以上的移動終端。基於積累的海量數據,我們拓展了在大數據領域的產品,包括極光廣告服務和極光數據服務。極光致力於為各行各業節約開發成本,提高運營效率,優化業務決策。

極光產品線

極光開發者服務:高效穩定 SDK、節約開發資源、增強用戶體驗、提升業務效率

極光廣告服務:精準鎖定目標用戶,量身定製廣告投放策略,提高運營效率

極光數據服務:解析目標客戶,洞悉行業趨勢,跟蹤企業運營情況,幫助企業決策者提升決策效率



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦