search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

李彥宏說數據秒殺一切演算法,BAT的金融大數據如何運作?

新年開工,李彥宏的內部信就在朋友圈中引發了一波刷屏。內部信中有一個點比較有意思,李彥宏說,「這樣一個時代,是很明顯的金融創新的新時代」 ,這充分表明金融業務將是百度未來的四大方向之一。而他的一句「數據秒殺一切演算法」,更是從側面透露了以大數據為代表的人工智慧技術將成為百度金融的必殺技。

金融創新很大一部分原因在於大數據和金融之間的結合。縱觀BAT、京東、小米、萬達、平安這些把觸角伸到互聯網金融領域的巨頭,無一不是在大數據層面上有所布局。大數據和金融相結合,幾乎已經成為金融領域的通用做法。

金融數據都像是煤礦,價值含量、挖掘成本更重要

談數據必須先談數據的完整度和價值含量。就像煤礦一樣,大數據中的價值含量、挖掘成本比數量更為重要。非結構化數據,就像是有雜質的煤礦,無法直接使用。大數據還需要進行脫敏、提純、結構化,才能變成可以被直接運用於商業層面的有價值的信息。

金融數據作為專業度要求更高的數據尤為如此。對於BAT三家而言,布局其實都比較完整。2015年年底的時候,阿里集團透露,在阿里數據平台事業部的伺服器上,攢下了超過100PB已處理過的數據。

BAT三家公司,數據體積相差不會太多, 三家幾乎都有LBS、交易、社交等一系列不同維度數據,只是能力有所區別。比如說,百度有地圖、貼吧、糯米、外賣、Uber、攜程、去哪兒;阿里有高德、微博、口碑、支付寶、飛豬、優酷等;而騰訊有微信、QQ、京東、新美大等。

三家數據核心優勢可以如此簡單劃分——

百度:基於搜索而誕生的公共數據、需求數據。百度的優勢在於數據最全面,數據樣本比較複雜,數據的廣度和多樣性上比較強,擁有核心技術和數據礦山,而且是一座富礦;

阿里:基於淘寶天貓業務而誕生的電商數據、信用數據。阿里的核心業務在電子商務上,數據比較聚集,更容易做分析。這種數據類型的優勢在於,更容易變現,挖掘出商業價值;

騰訊:基於微信、QQ誕生的社交數據、關係數據,以及遊戲數據,相對較雜。不過,容易分析人們的生活和行為,從裡面挖掘出商業、健康等領域的信息;

大數據領域有這樣一種說法——所有的數據都是風險數據。而拍拍貸風險副總裁顧鳴博士之前提出過一個金字塔結構圖。

在這張圖中,徵信數據位於金字塔的頂端。往下走是消費數據、運營商數據、社交數據、行為數據以及其他數據。越是靠近金字塔的頂部,大數據在風控領域的應用就會越直接,獲取數據的難度隨之增加,覆蓋率當然會降低;相反,越是靠近金字塔的底部,大數據在風控方面的應用難度就越大,但是數據的數量和覆蓋率都會變大。

把BAT三家套入這個金字塔結構中就會發現。阿里的數據離變現幾乎只有一步之遙。阿里以電商-支付-信用為三級跳板,針對性很強,數據價值純度高,金融數據的整合上做的也比較完善,缺點是覆蓋面還是不夠。不過,這些年來不斷收購、入股優酷、微博、高德等一系列企業,阿里數據維度其實也在越來越豐富,也在不斷往金字塔的底層下探。

騰訊有社交、行為數據,這些數據不能直接運用,但獲取的信息會更豐富。而騰訊目前的大數據策略是先將產品補全,產品後台數據打通,形成穩定生態圈。本階段先利用大數據挖掘改進自己的產品。後期有成熟的模式合適的產品,則利用自家的社交及關係數據時,開展對大數據的進一步挖掘。

雖說有人認為百度和騰訊很多數據是非結構化數據,在風控上的運用難度較大,很難直接商業化。不過,這些數據恰恰是金字塔最底層的數據。在普惠金融的環境下,互聯網全域大數據帶來的價值不可忽略。

特別是百度的數據最為全面、完善,覆蓋面最廣。互聯網環境下,每個人都會在網上留下痕迹。因此,位於底層的互聯網行為數據覆蓋面最廣,維度最多樣,對破解數億成年人尤其是草根群體的信用空白難題幫助最大。

表面上看這些數據大多數和金融無關,但如果挖掘得當,能夠通過建立模型,給用戶勾勒出比較準確的畫像。讓那些看似與風險不太相關的數據在互聯網金融風控的場景中體現價值。事實上,百度自然語言識別和深度學習的技術上在三家中也是最強,可以做出基於7個維度28個行業,細分10萬+個標籤描述用戶的屬性,加上在數據演算法上能力突出,優勢非常明顯。

值得注意的是,百度還結合更多外部數據,如運營商數據、政府部門公開數據、線上/線下交易數據等,一方面填補現有徵信人群的空白,另一方面對業界已有數據進行有效補充,擴大徵信範圍。

四個角度告訴你,金融大數據到底用在了哪些地方

因為數據維度越豐富,對用戶粗顆粒的畫像就會越了解。某一個畫像的用戶到底喜歡什麼,都可以一清二楚地了解到。企業也能夠面對做很多有針對性的營銷。

尤其是在金融領域,企業對大數據掌握越全面,所能涉及到的業務也會越豐富。BAT數據最豐富,在金融業務領域橫亘支付、貸款、理財、保險、證券、銀行、徵信、基金、眾籌等各個領域。而小米、京東、萬達等企業因為體量、數據等相對而言優勢不大,則會在這9個領域中缺失某些領域的布局。

BAT在9個領域的布局,其實都是以大數據為核心串聯在一起的。無論是徵信、風控、消費金融、財富管理都或多或少運用到了大數據。

1、大數據徵信:在個人徵信領域,目前是金融行業面臨的最大問題。基於用戶在互聯網上的消費行為、社交行為、搜索行為等產生的海量數據,其價值並未被充分挖掘,個人徵信在大數據的採集和信息挖掘上面仍有很大的想象空間。阿里的芝麻信用在其中算是最會玩的。芝麻信用幾乎打通了用戶的身份特質,行為偏好,人脈關係,信用歷史,履約能力等各類信息。這恰恰是因為接入了電商、支付、社交等各類數據維度。

2、大數據風控:大數據風控目前應該是前沿技術在金融領域的最成熟應用,相對於智能投顧、區塊鏈等還在初期的金融科技應用,大數據風控目前已經在業界逐步普及。目前,美國基本上都用三大徵信局的信息,最傳統的評分基本上都是用FICO來做的。各家平台會嘗試著用機器學習、神經網路等大數據處理方法。

國內市場對於大數據風控的嘗試還是比較積極。特別是大公司,可以將移動互聯網的行為和貸款申請人聯繫到一起展開大數據風控。百度在風控層面上的進展還是比較突出,百度安全每天要處理數十億網民搜索請求,保護數億用戶的終端安全,保護十萬網站的安全,因此積累了大量的數據。

一個很具體的案例就是,通過海量互聯網行為數據,比如監測相關設備ID在哪些借貸網站上進行註冊、同一設備是否下載多個借貸App,可以實時發現多頭貸款的徵兆,把風險控制到最低。

3、大數據消費金融:消費金融對大數據的依賴是天然形成的。比如說消費貸、工薪貸、學生貸,這些消費型的金融貸款很依賴對用戶的了解。所以必須對用戶畫像進行分析提煉,通過相關模型展開風險評估,並根據模型及數據從多維度為用戶描繪一個立體化的畫像。

百度金融的優勢在於,通過基於大數據和人工智慧技術為基礎的合作商戶管理平台,為合作商戶提供涵蓋營銷和金融服務的全面管理方案,降低獲客成本,解決細分行業的微小需求。一方面可以降低風險,另一方面也能提升金融的安全度。

在大數據消費金融的領域中,騰訊和阿里的優勢很大程度上是在渠道層面上的。正如前文所說的,阿里以電商-支付-信用為三級跳板,針對性很強支付寶接入消費金融產品之後會有較強的渠道作用。而在去年12月,騰訊的「微粒貸」已經接入到了微信支付當中。在消費金融的發展速度上,騰訊速度也不差。

4、大數據財富管理:財富管理是近些年來在金融服務業中出現的一個新業務。主要為客戶提供長期的投顧服務,實現客戶資產的優化配置。這方面業務在傳統金融機構中存在的比較多。不過因為技術能力不足,大數據財富管理在傳統金融機構中相對弱勢。

財富管理在互聯網公司的業務中也非常流行。螞蟻金服一開始最為簡單的財富管理方式就是餘額寶,後來逐漸演化成經過大數據計算智能推薦給用戶的各種標準化的「寶寶」理財產品。百度金融相對來說更進一步,是依託「百度大腦」通過互聯網人工智慧、大數據分析等手段,精準識別和刻畫用戶,提供專業的「千人千面」的定製化財富管理服務。

金融大數據的孿生兄弟金融雲是地基,未來更具看點

大數據和雲計算永遠都是相伴相隨的一對孿生兄弟。金融大數據核心工作包括三方面,即獲取數據、建立模型、模型在實踐中優化、迭代。而對於金融大數據而言,金融雲才是它的地基。

打個不恰當的比方,前文中說大數據是煤礦,而金融雲其實就是礦井。礦井的安全行、可靠性決定了挖煤的效率和結果。

金融雲把底層技術很多問題都解決了。大量金融模型都是金融雲所引入的,如客戶模型、產品模型、賬務模型等。同時金融雲關注金融本身的嚴謹性和周密性、安全性的考慮。

2016年7月,「騰訊雲+未來」峰會上,騰訊雲和騰訊金融雲都已成為最重點部署的業務。同年9月,百度世界大會金融科技分論壇上,百度金融雲正式向業界開放。據時任百度金融研發負責人沈抖表示,百度金融雲將通過人工智慧、安全防護、智能獲客、大數據風控、IT系統、支付等六大技術能力給合作夥伴賦能。10月,阿里雲棲大會上,阿里金融雲負責人則是提出將會和生態合作夥伴、服務聯盟為金融行業量身定製推出雲增強服務。

大數據必須要跑在雲端,而金融大數據更需要和業內其他企業展開數據、支付、業務等一系列的合作。金融雲對可用性、安全性的要求嚴格,比如說對一個高度可控可信的雲安全體系而言,基礎環境安全、風控與審計、數據安全三者缺一不可。而金融雲在未來的競爭中將發揮越來越重要的作用。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦