search
2017GAITC智能金融分論壇實錄丨 王健宗:「智能+」時代的金融大數據應用

2017GAITC智能金融分論壇實錄丨 王健宗:「智能+」時代的金融大數據應用

主題:智能金融分論壇

時間:2017年5月22日上午

地點:國家會議中心403

本文根據速記進行整理

「智能+」時代的金融大數據應用

王健宗

平安科技大數據部高級產品總監,平安集團深度學習平台總負責人

下一位是王健宗博士,我們的安排是一位學界嘉賓,一位業內嘉賓,希望這個活動就像秘書長講的要產學研結合。王健宗博士來自於平安大數據高級產品總監、深度學習平台總負責人,宣傳冊上寫的是肖京博士,肖總今天有特殊的任務,平安保險大家知道,實際上平安是一個大麥克的公司,平安員工有130萬人,平安科技是其中一個子公司有8千人。我們講人工智慧、金融科技,平安是乃至世界上一支不可忽視的力量。王健宗是專門負責平安大數據平安科技的深度學習,我們在這個世界上已經聽了太多深度學習上的事情,但是有一個前提,你的數據到底是不是夠多,質量到底是不是足夠好,你如果用這幾個標準一衡量的話,很多事情是不成立的。

有多少人買平安的保險,你們為平安大數據做了貢獻,平安有大數據,他是可以做深度學習的,所以我非常期待王健宗博士給我們一起來分享在大數據的情況下怎麼做深度學習,有請王健宗博士。

王健宗:謝謝主持人,講得比我好多了,大家聽過之後恨不得現在就去買一個保險。今天這個論壇是智能金融論壇,我們理解智能金融其實就是人工智慧的金融,AI+金融,我今天演講的題目就是智能時代下的金融大數據應用。我4月底在這個會場全球移動互聯網大會有一個講話,時間比較短十五分鐘,今天很感謝柳博士給了我三十分鐘,我要好好利用好這三十分鐘,把我們過去平安做的工作和我們團隊做的工作給大家做一點小小的彙報,後面的交流時間請大家多多提意見。我們現在開始。

現在互聯網+談的是比較少的,主要是模式的創新,去年從阿爾法狗開始到今年一年多時間,大家談的更多的是人工智慧和智能+,我們更多的要思考的,人工智慧不是一個新的名詞,比起大數據和雲計算來說,人工智慧60多歲了,我第一次聽到大數據是在美國2011年底,雲計算2007年開始,雲計算就十年,大數據就五六年,人工智慧已經六十年了,六十年是一個老人,為什麼一個老人煥發出嬰兒一樣的生機呢?更多的我們需要把人工智慧結合一些應用做一些應用的創新。比如從傳統的信息化、數據化到智能化,我們現在已經到智能的時代。

數據這個價值大家知道,從最底層的Data到information到知識到wisdom,數據越智能越具備自我學習能力,數據活躍度、數據使用的頻次是越高的。平安從1988年到今天有差不多29年時間,今天是我們29年的司慶,怎麼把我們的業務規則數據化信息化自動化,這是我們一直在思考的問題。我以保險理賠為例,大家都會買車險,一個車出險理賠有幾千條規則,這裡有三長一短選這個,三短一長選這個。但不只這些,車險理賠是幾千倍規則的列表去驅動,這個規則是近三十年時間積累的規則,現在很多互聯網公司要做保險,做保險行業非常需要業務積澱和相關經驗的底蘊,現在有些大的互聯網公司要進入保險業很難進入,因為保險非常要有積澱,非常要積累和經驗。

我們把過去三十年的這些業務經驗、業務總結,一直在想辦法數字化,想辦法自動化,這是我們做的一些工作。傳統的方法,現在很多公司在做BI業務分群,大家會發現通過業務分群觀念分析這樣的工作,解決不了長尾問題,大部分用戶你很難能get到他的特徵,真正能輔導他。完全靠業務規則,我們有,但是把程序寫成業務規則,怎麼樣去驅動,這些規則有些是相互,加上後來BI,沒辦法解決長尾問題,沒有人工智慧,以前踩的坑就不能避免掉。

人工智慧三起三落。我很想舉《西部世界》這個例子。這是個老的劇本,在《西部世界》里很難判斷出這裡面到底誰是真人誰是機器,只有一槍把它斃掉,才能證明它是機器。大家在生活中會發現感受不到很多機器都在運轉,微信裡面很多就是機器人,圖靈測試,要不跟機器對一首打油詩,機器能跟你靈活對打是不是就是人呢。最近我看報道,大公司的聊天機器人能夠作詩了,用作詩的方式去驗證也不夠。淘寶上購物的時候後面很多評論,很多評論是機器評論,阿里巴巴沒辦法,有一個產品是做眾包的,每天會發一些任務,任務是希望你能通過你的人為判斷找到哪一些廣告帖是人工評論的,哪些是機器評論的,任務一天經常是幾百萬的量,後面又衍生出一些問題,怎麼樣把機器和人識別出來。

這一次人類是不是又要完蛋了?不好說,但是我還是持謹慎樂觀態度,這次人工智慧三個因素,我們有強大的異構計算能力,像GPU、FPGA、AI晶元,這些是很好的硬體的支撐。第二,被講爛的大數據,今年明年講大數據會越來越少。第三,深度計算,三個因素疊加,人工智慧現在有這次機會,我希望這次不要很快就死掉,我自己本人和我們公司都在人工智慧應用方面做一些工作,效果還不錯,我還是比較樂觀的。

阿爾法狗,去年我經常會放這張圖,我不過多解釋了,我很期待這周的比賽,跟柯傑的比賽在23日,這次比賽我先做個預測,柯傑會跟去年李世石一樣贏一場,大家到時候看一看比賽結果。人下棋下不過計算機,後面在很多領域也干不過計算機。已經有醫生和機器比賽,一千個片子看誰看得准,在一些專業領域機器慢慢在取代人的工作。李開復在一些大學里講未來50%的工作都要被機器取代,很多工作都要消失掉。我常常開玩笑,無人駕駛很火,以後開車就是個貴族運動,就跟騎馬一樣,無人駕駛出來之後都不需要開車。

對於專業領域的人工智慧來說我們慢慢有些進步,也有些大家目前看到的問題。我們怎麼樣解釋它,我本身是負責我們公司深度學習組的,業內也沒有哪個金融機構有我這麼大的組,問我模型的運作模型是什麼,可解釋性深度學習是比較差的,圍棋下贏以後,人家說圍棋的主流是AI流,在學AI的打法。現在有很多公司、很多學校老師教授要做深度學習,我心想數據都沒有做什麼深度學習。有些保險公司剛剛出來一兩年,連保險的理賠案件都沒有,他說要做人工智慧理賠保險,也不是非得大數據,我們是否也探索小數據小樣本的深度學習,這是未來要去突破的。要有記憶增強網路等等,都是可以去嘗試的。技術是不斷在發展的,我們要結合應用去做更多的探索。

回到金融,從去年到今年智能投顧非常火,柳博士的公司就是已經在智能投顧、培養智能的交易人方面是業界領先了,機器人去做一些投資,大家看這個曲線,如果你的模型訓練足夠好是有可能超過人的組合。這只是其中的一個小應用。這個圖是我首次發布的,今天來的都賺到了,我花好長時間研究金融人工智慧,我上次在GMIC都沒有講這個東西,其實金融人工智慧的應用場景是非常多的,營銷風控運營決策,這個圖要講半個小時講不完,因為我講起來是發散性思維,我快速過一下,從金融領域關注的外圍的大盤、營銷、決策、運營、風控,再到相關的技術支撐,深度學習技術、機器學習技術,裡面有核心的相關的工具、模型、演算法來支撐外圍的金融應用,是非常多的。

我經常跟我的團隊說你們做一個領域出去其實都是可以開一家創業公司,現在做風險預警、反洗錢的、幫助一些銀行或者小微公司做快速徵信評估,現在已經實現急速的個人評估的方法,後面都是機器人審核,傳統銀行審核得幾周,去企業貸款審核時間更長,還要實地考察,金融領域是非常多的。平安有130萬人,有100萬保險代理人,保險代理人也是全數字化全智能化的運營和管控,我們有做很多工作,包括推薦用戶畫像。因為時間關係,我對裡面相關領域會擇優來講。

平安是一個全牌照金融公司,同時也有保險、銀行、證券、互聯網應用,我不是做廣告,平安科技是專門服務於平安的科技公司,現在也在轉型AI和金融大數據公司,所以我們在人工智慧、區塊鏈、金融雲、大數據也構建很久了,應該是全球最大的大數據平台,我們這塊做了很多工作,服務於相關的傳統金融和互聯網金融。

這個圖也是全球首次發布,大家可以看一看,這是我們大的平台架構,我們從大數據起步開始,一直到現在做五六年的時間,我們從底層數據到形成一個畫像臉譜,用戶畫像、產品畫像、渠道畫像,形成我們要做交叉銷售和渠道這塊。我們整個構建的是金融的平安網,整個智能引擎去支撐BI結構化數據非結構化數據預測監控,支撐我們相關的應用,智能、運營、機器人、健康、營銷、風控、欺詐等等。

這是非常通用的客戶交叉,從客戶獲新,一段時期里做交叉銷售,最後怎麼去做客戶挽留的工作,這是經常看到的圖。通過用戶畫像、產品畫像加上渠道畫像,實現互聯網和傳統用戶的千萬級的遷徙和轉移,客戶這個產品的跨度從1點幾到2點幾到接近3,這是很大的突破。後面通過相關的人工智慧技術的支撐。我們做風險的預警,通過個人的風險量化、個人的徵信,做風險的監控。整體上有個人的團體的企業的服務於銀行、健康、投資、集合等等,這是我們通過社交網路的分析,像徐翔這樣的熱點事件,提前做一些風險和管控,背後有自動的風控官。

分析車險的相關事件,這個圖是平安好車主,在行駛過程中預警哪個地方是事故高發的地段,這個時候要注意。還有輿情分析,企業關係網路等等。同時我們也做非結構化數據的分析,非結構化數據分析,有些欺詐案件車壞之後要4S店老闆打一個電話,我們發現有個人在某個市某個區的某個4S店老闆一個月密集打十幾個電話,我們通過後台語音的分析、聲紋分析比對,定位這個人是高風險用戶,欺詐度比較高。有一個小額貸的普惠會做線上貸款,審核員跟你面對面溝通過程中有微表情的提示、測謊,我們都有技術輔助。

圖像方面,一個車都有些欺詐,我們需要提早預知這張圖片是否有偽造。非人類特徵識別,現在很大一個程度國內自然災害和天氣導致農民損失很嚴重,我們構建豬的生物特徵庫、鴨的生物特徵庫、鵝的生物特徵庫,現在國家補貼很大,經常會有一個問題,一頭豬國家給你10塊錢20塊錢投個保,如果發生病害去除自然死亡的病害,長到育肥豬的時候突然死掉了,這個時候他找我理賠我要判斷這頭豬就是育肥豬的這頭豬,非人類生物特徵,我們也在做這塊,服務於農業險。

人臉識別很成熟,我們都是很創新,這塊欺詐很多,有一個村裡投500頭豬,有些豬不是全投的,如果全投沒關係,只要死就賠,有些只賠一半,這頭豬死掉了之後,我不知道這頭豬是否投保。以後要擴展到寵物,養金毛很貴重,投50塊賠1萬塊,最後怎麼證明這隻狗就是理賠的這隻狗,我們都在做這塊。構建非人類特徵識別庫,這是非常超前的,也有很多技術挑戰,這個領域也非常大。舉剛才豬這個事情,我們做過市場調研,每年市場100億。保險作為財產險來說各種各樣的動物都需要識別反欺詐。

我們也做全渠道的接觸,能夠服務好客戶,催收方面我們會分析個人行為,制定不同的催收策略,智能化,減少催收的人力或者粗暴催收。我們自己也有一個機器人做門店的運營,有機器人做一個客服。

AI在金融行業是大有可為的,我只是舉的工作的1/10給大家做彙報,待會兒對話大家可以深度討論,這是我的微博,我們可以深度交流,謝謝大家。

主持人:王健宗剛才提到特別重要一點,豬的生物特徵識別,我第一次聽說做豬的生物特徵識別,最重要一點是需求在哪裡,這個世界上有太多做人臉識別的,只有真正知道需求在什麼地方的時候才能想出豬的生物特徵識別。考勤人臉識別,解決你是你的問題,當然現在還沒有解決你媽是你媽的問題,煤礦工人下井上來臉全是黑的,這個時候怎麼解決他是他的問題,能指紋嗎?這個時候用虹膜識別法,如果這個人出了事故以後怎麼理賠的問題,剛才他講了豬的理賠問題。第二個有意思的事情是計劃生育,很多人為了生孩子,你無法知道這個人到底生的多少。為什麼請王健宗來,王健宗是知道真正的數據長什麼樣子,知道需求在哪裡,如果要雇一個殺手一定要找一個殺過人的殺手,如果要找大數據專家一定要找真正摸過大數據的專家。

CAAI原創 丨 作者王健宗

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23299次喜歡
留言回覆
回覆
精彩推薦