search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

如火如荼的金融大數據行業洗牌在即

黑市數據泛濫,大多還在最初級的數據收集

去年以來,隨著互聯網金融,尤其是消費金融的火速發展,大數據風控也火爆起來,不少專註於大數據風控的公司,如百融、量化派、同盾科技、聚信力等頗受資金市場追捧。與此同時,這類公司也存在一系列問題,比如信息源獲取的合法性、利用數據的有效性等等。

今年5月開始,監管也開始了對大數據行業的清查。再加上近期有媒體稱,由互聯網金融協會牽頭,包括首批個人徵信試點機構中的芝麻信用、騰訊徵信等相關機構,欲攜手打造的個人徵信機構「信聯」,可以預見,將對大數據行業帶來很大衝擊。未來,行業也將迎來一輪洗牌。

海量數據是基礎,用於防範欺詐和信用風險

近年來,隨著傳統銀行轉型、網貸平台限額,消費金融、現金貸由於無需抵押可以迅速上量,由此催生了基於大數據應用的線上精準獲客和風控體系。

據業內人士介紹,大數據風控服務,主要包括利用大數據技術來防範欺詐風險和信用風險。

欺詐風險一般就是我們常說的識別「黑、灰、白名單」,黑名單就是我們俗稱的「老賴」,惡意賴賬的人群,白名單即是信用記錄良好的人群,而灰名單則為兩者之間;防範信用風險則是依託大數據描述的用戶圖像,比如受教育程度、行為偏好、工作是否穩定等,據此來綜合預測個人還款能力。

大數金融首席風險官漆瑾聲曾對新快報記者表示,國內所說的「大數據」,在美國習慣被稱之為「替代性數據」(Alternative Data)。這是源於當時美國有部分人群個體徵信數據的缺失,於是水、電、煤等這些替代性數據就派上用場了。

他表示,依照與個人信用關聯程度,數據可以大體分為兩類:一種是傳統徵信數據,也就是強相關數據;另一種是弱相關數據,比如社交數據、水電煤及經營數據等。

他表示,現在國內註冊的大數據公司有數萬家,但不少公司的數據源都是「替代性數據」或弱相關數據。「只有經過實踐驗證過的數據才是有效數據,現在市場上普遍流行的社交信息、非還款負債信息等,嚴格來說不屬於準確意義上的徵信數據。」

由於目前國內徵信體系的不完善,因此目前行業中的大數據以弱相關數據為多,包括利用一些行業數據、用戶的互聯網瀏覽數據、司法執行數據、第三方信用數據、出行數據、電商平台的交易數據、電話通信數據和社交數據等等。

「很多大數據風控公司的數據獲取並未獲得政府部門渠道查詢的授權,數據要麼是爬取的,要麼是各種渠道購買的。」有業內人士表示。

在網路上,也有很多售賣用戶信息的公司。這類公司可以公開爬取用戶支付寶、網貸賬號、郵箱、網銀等信息。行業中購買數據已然成了「公開的秘密」。從各個渠道挖取用戶數據,通過電話號碼、身份證等唯一標識碼(對某一類數據中某個實體進行唯一標識的代碼),進行不同數據的整合,最終挖掘出用戶的有用價值,加以變現。

「公司之間隨意將用戶隱私信息進行交換、交易等,這實在是太正常的情況了。」該負責人表示。此前,在販賣個人信息的QQ群中,新快報記者也注意到,曾有中介打出0.5元購買一人家庭住址的信息。

不少大數據公司的產品說明書中均表述有著大量電商風險名單,但是對於這類數據是否得到合規授權卻鮮有披露。比如新快報記者獲得某知名數據風控公司業務介紹PPT中關於數據概括一欄就顯示「有千萬級失信名單,來源於合作夥伴反饋的黑名單;10億+的互聯網泄露數據等」,但並未顯示這些數據是否得到用戶授權。

不過,該公司相關負責人則表示前述業務介紹為2016年以前的舊版本,「公司業務均合法合規,相關業務開展都以授權和脫敏為前提。」

有業內人士表示,大數據公司最需要注意的地方,在取數據時「是否得到客戶授權」。這決定了數據獲取的可持續性。早在去年徵信管理局就出台《徵信業務管理辦法(草稿)》,規定了信息使用需獲信息主體授權同意;今年6月開始實施的《中華人民共和國網路安全法》也規定了任何個人和組織不得竊取或者以其他非法方式獲取個人信息,不得非法出售或者非法向他人提供個人信息。

有業內人士透露,目前行業中從網路獲取大數據分為兩種,一種是爬蟲技術,又分為公開信息爬取和授權爬取。公開信息則可以通過各類公開網站信息獲取,但是後者爬取涉及用戶個人信息的比如電商網站則需要得到用戶授權。

此外,除了上述方法外,還有業內人士表示,還有一種技術是可以通過嵌入某種代碼的軟體開發工具獲取信息。「這種軟體一旦嵌入后,如果你註冊登錄了這個APP並默認授權,所有的行為數據都能記錄,在神不知鬼不覺的時候就能爬取手機通訊錄、聊天記錄、銀行賬號密碼、定位等信息。」

行業洗牌在即,將迎來監管

雖然行業中號稱做「大數據」的公司不少,但大多還在最初級的數據收集、買賣階段,真正的數據清洗、應用技術,還處在探索階段。而黑市數據泛濫,個人隱私泄漏嚴重的問題,已經被監管部門治理。

有業內人士表示,不僅僅是數據獲取上,在利用數據上行業中各種大數據公司也參差不齊。「數據清洗,特別是變數衍生的工作,技術含量其實是很高的,需要經過專業訓練,」該人士表示,最好是有不錯的業務經驗,對業務有比較透徹的理解,但是當前現狀,很多公司從事數據清洗的團隊接受的訓練和業務經驗往往都不足。「坦白說,在信用風險領域,市場上海量的大數據普遍存在著變數相關性不強、數據質量良莠不齊的問題。」

早在今年5月,數據行業開始了大清洗,監管部門開始清查大數據行業。同樣在5月,最高人民法院通報了新的司法解釋,明確了「非法獲取、出售或者提供行蹤軌跡信息、通信內容、徵信信息、財產信息等個人敏感信息五十條以上的,即構成犯罪,處三年以下有期徒刑或者拘役。」

此外,近日有媒體報道,由互聯網金融協會牽頭,包括首批個人徵信試點機構中的芝麻信用、騰訊徵信等,以及百度、網易、360等相關機構,欲攜手打造的個人徵信機構「信聯」目前的籌建已進入實質階段,平台架構搭建已開始運作。

有業內人士表示,「信聯」的籌建顯然是為了解決目前非銀領域信貸數據由於分散不集中衍生的諸多問題,定位在於人民銀行徵信中心的重要補充,直接作用則是變相解決此前個人徵信牌照「難產」兩年的困局。「此前的試點機構,一些企業本身既有基礎數據,又做借貸業務,再出個人徵信報告,就會存在既當運動員,又當裁判員的問題,在程序上就難以保證公平性,」開鑫金服總經理周治翰也表示。

「網聯的成立,對於主營業務是數據買賣的公司而言,生存壓力越來越大。」有業內人士表示,大數據行業,進入了洗牌期。「一個行業的發展必然會經歷混沌到監管再到規範的過程,期待行業經歷清查、整頓后最終形成一個良性的環境。」

人民銀行徵信中心原資深顧問李銘則認為,徵信在國內是一個被嚴重誤解的行業,在當前很多人還沒有信用歷史的現實情況下,徵信機構使用大數據技術作為風控手段是可行的。「考慮到合法合規和業務流程,他推薦可以利用心理測量學取得數據,其在信息相關性、數據主體權利、許可等方面不會帶來很多麻煩,預測能力也很強,」他強調,「我們唯一要注意的是隱私保護的問題」。

往期精彩文章

王叄壽:絕對專業、絕對敬業的人才能天下無敵

大數據領域有一批神奇的「獨立縱隊」在研發秘密武器

扎心長文:數據變現難,有「七宗罪」待解

這家公司企業文化有點個性:太陽不下山,公司不開會



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦