search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

KDD 2017 | Data Science in China論壇:大牛雲集,掀起產學結合新高潮

北京時間8月16日(美國當地時間8月15日),在加拿大哈利法克斯舉行的第23屆國際數據挖掘大會(KDD 2017)進入主會議程。

KDD China在大會第一天的主會議程中組織「Data Science in China at KDD 2017」的分論壇,集中展現在數據挖掘領域的進展和華人在該領域的研究成果,雷鋒網作為特約媒體參加論壇並進行了獨家報道。

半壁江山,數據挖掘最強華人力量

前一天開幕式上顯示的數據表示,在KDD 2017大會上,來自的參會者僅次於美國。在開幕式上的頒獎儀式中,不僅裴健教授、楊強教授分獲KDD創新獎和KDD傑出服務獎兩項分量最重的大獎,隊伍還幾乎包攬了KDD CUP兩個競賽題目的前十名。此外大會的「與大咖面對面」的現場交流活動中,五位嘉賓有三位是華人,大會的開場Keynote也由UC Berkeley的Bing Yu教授演講,雷鋒網再次感受到了數據挖掘領域崛起的華人力量。

在大會頒發的資料中,雷鋒網還發現了這樣一個有趣的統計:Microsoft Research對近5年KDD高影響力作者進行了一個評估,如下圖所示,其中泡泡大小代表發表文章的數量,縱軸反映了論文作者在KDD發表的每篇文章引用數排名(代表文章的質量),橫軸是把不同作者論文的引用關係連城一個異構網路,再用類似pagerank的方法計算每個作者的影響力,越靠近右上角排名越高。從圖中我們可以看到多位華人學者名字,佔到了圖中高影響力作者的半壁江山。

大牛雲集:八位演講嘉賓,37萬引用

「Data Science in China at KDD 2017」論壇由China Chapter of ACM SIGKDD(KDD China)承辦。KDD China秘書長鄭宇表示,這是KDD大會上連續第三年舉辦主題的分論壇。

論壇邀請了八位來自數據挖掘領域傑出的華人教授、科學家以及工業界精英進行了精彩的報告,ACM數據挖掘領域的三位Fellow韓建煒教授(2003)、劉兵教授(2015)、裴健教授(2015)也來到現場,其中劉兵教授主持了第一個議程,裴健教授進行了報告。

在微軟亞洲研究院主任研究員、KDD China 秘書長鄭宇博士的主持下,分論壇在下午1:30開始。楊強教授致開幕詞並回顧了KDD在的發展歷史。他說,AI在和資料庫在都是熱門領域,但KDD相對來說知道的人卻沒有那麼多。回想1989年 KDD第一次在開workshop到現在,有很多先行者為KDD在的發展做出了貢獻。現在KDD China已擁有800名會員,在KDD上也展示了自己的力量,與包括鄭宇、周志華等在內的KDD China管理團隊努力分不開。楊強教授同樣對兩位SIGKDD華人主席劉兵、裴健以及KDD 2017大會主席俞詩鵬對KDD China工作以及本次分論壇召開的支持表示了感謝。

隨後的論壇分兩個議程進行。

第一個議程由劉兵教授主持,楊強教授首先做了《Feature Engineering and Transfer Learning》(特徵工程與遷移學習)的報告。

楊強教授介紹,特徵工程就是一個把原始數據轉變成特徵的過程,在典型的數據挖掘過程中,特徵工程是選擇數據之後的第二步,處於承上啟下的重要位置。楊強教授指出,特徵比模型更為重要,因為特徵對於模型來說是中性的,這也是遷移學習的基礎。楊強教授還詳細介紹了將遷移學習與機器學習結合的應用,如將用戶微信小額交易數據挖掘用於購車等大額消費的例子,在演講最後的「Big Data is useless unless it can deliver big feature space」的總結也得到了隨後多位演講者的贊同。

(香港科技大學楊強教授)

隨後來自羅格斯-新澤西州立大學的熊輝教授帶來了題目為「Talent Analytics:Prospects and Opptunities」的報告,介紹了數據挖掘在在人力資源及企業管理的應用,包括:利用數據對人才進行評價和意願分析,以輔助升職考核、招聘等流程。

熊輝教授稱,企業人力資源的數據挖掘有三個層次,包括人、企業與文化層面,目前的主要研究工作集中在人的層面,下一階段會繼續對企業及文化層面進行研究。

(羅格斯-新澤西州立大學熊輝教授)

來自微軟亞洲研究院主任研究員鄭宇博士的報告題目為《Urban Computing——Urban Big Data Platfrom》。

在報告中鄭宇博士介紹了城市計算機城市大數據平台在市政規劃工程中的應用,由於城市大數據存在大規模和變化性的特徵,需要基於雲的城市大數據平台進行處理,通過不斷獲取、整合和分析城市中多種異構大數據來解決城市所面臨的挑戰,通過人工智慧來幫助改善公共交通。在報告中,鄭教授還通過如流量預測、與貴陽市政府的合作、與基於共享腳踏車的腳踏車道規劃及車輛管理等實際工作進行了詳細介紹。

(微軟亞洲研究院主任研究員鄭宇博士)

論壇議程二由UCLA的王薇教授主持。今日頭條科學家李磊博士介紹了今日頭條的新聞機器人、寫稿機器人等實際應用及在深度綜合、語言生成、語言建模、深度學習QA系統CFO、面部識別方面的研究工作。

葉傑平稱,滴滴的核心是一個交易平台,匹配是滴滴業務中的關鍵問題,並介紹了滴滴在用戶與司機的匹配從群發信息、定向推送、精確匹配的三個階段,利用機器學習提高ETA準確率和預測目的地、推薦上車點等兩個創新,以及大數據預測司機服務分值、提升用戶體驗等實踐。

(滴滴研究院副院長葉傑平)

隨後西蒙弗雷澤大學裴健教授帶來了《Data Science & AI in China industry:some personal experience》的報告。

報告從人工智慧產業化以及將人工智慧應用到傳統行業出發,探討如何解決供應鏈、製造業等等傳統行業數據無法自動收集、複雜和非標準化的應用場景、技術問題難以轉化成典型的AI問題等挑戰,並結合了裴健教授與華為的合作為例進行詳細介紹,包括基於華為內部供應鏈端到端優化,實現智慧化模型、風險控制、熱線客服等,希望用AI改變整個生產流程等實踐,並分享了作為學術研究者在最近一年來與華為合作的收穫。

另外,裴健教授也是本屆KDD大會創新獎(2017 ACM SIGKDD Innovation Award)的獲得者。

(西蒙弗雷澤大學裴健教授)

清華大學的唐傑博士介紹了AI和深度學習在慕課(MOOCs)教育中的應用。值得一提的是,KDD Cup 2015的競賽題目「用大數據預測MOOCer是否會『翹課』」就出自唐傑博士之手,這一報告也是其後續的相關研究,並展示了通過小木機器人做慕課助教與學員進行智能交互改善學習,以及利用LadFG提升預測準確率,提升慕課教育效果的實踐。

(清華大學唐傑博士)

同樣來自清華大學的崔鵬博士則帶來了社會動力學中的建模問題的分享。由於人的行為機理的複雜性以及動態性,而傳統機器學習方式類似黑盒,難以將社會動力學研究特徵化,也難以做持續的預測,通過物理學模型及數據驅動相結合,已經可以構建一個關鍵統計指標和真實社交網路基本一致的社交網路,可以對社交網路信息傳播進行準確的預測。

(清華大學崔鵬博士)

在第一個議程結束后,會議組織者與報告嘉賓合影留念。這張合影可謂珍貴:組織者和嘉賓中包含2位SIGKDD主席(劉兵@2013,裴健@2017)、2位KDD大會主席(楊強@2012,俞詩鵬@2017),三位KDD大會PC Chair(楊強@2010,王薇@2014,熊偉@2018),兩位KDD創新獎獲得者(韓建煒@2004,裴健@2017),三位KDD傑出服務獎獲得者(裴健@2015,王薇@2016,楊強@2017) ,論文引用總數超過37萬,可謂匯聚了華人數據挖掘領域的中堅力量。

照片後排左起: 清華大學副教授崔鵬、微軟亞洲研究院主任研究員、KDD China秘書長鄭宇、美國羅格斯-新澤西州立大學教授熊輝、美國亞利桑那州立大學教授劉歡、滴滴研究院副院長葉傑平、KDD 2017大會主席俞詩鵬、今日頭條實驗室科學家李磊、清華大學副教授唐傑;

前排左起:美國伊利諾伊大學芝加哥分校教授、SIGKDD前主席劉兵、美國伊利諾伊大學香檳分校教授韓家煒、香港科技大學教授、KDD China主席楊強、加拿大西蒙弗雷澤大學教授、SIGKDD現任主席裴健。

(雷鋒網註:本次分論壇議程二的主持人,UCLA教授、本次KDD大會創新獎與KDD傑出服務獎提名主席、KDD 2016傑出服務獎得主王薇,因為在大會還有其他事務,在拍照后才趕到,因而不在本照片中)

大數據需要更多產學合作

隨著大數據的不斷積累以及計算能力的快速發展,與其相關的人工智慧研究也得到了快速的發展。如同楊強教授在本次論壇上所言,數據挖掘的核心在於「挖掘」而非「數據」,在數據量暴增的同時,與之對應的數據選擇、演算法、特徵工程也更重要,掌握學術前言趨勢的學術界與掌握大量數據的產業界需要更緊密合作,推動數據挖掘與人工智慧的發展。

雷鋒網了解到,在諸多學術會議中,KDD屬於學術與產業相結合較為緊密的會議之一。

在本次分論壇上,多位嘉賓的報告內容均與產業緊密結合,讓我們得以了解了學術界與產業界就大數據與人工智慧話題技術的交流動向,以及大數據和人工智慧的最新先鋒應用。祝願通過本次論壇的召開能夠擴大華人在國際數據挖掘領域的影響力,推動國內數據挖掘領域的研究和在工業界的應用和發展。

CCF-ADL在線講習班(第80期):區塊鏈—從技術到應用

本次課程為付費課程,2017年8月會在AI慕課學院獨家上線,原價 2500 元(CCF 會員)的線下課程現在限時特價 699 元預售,有興趣的學員戳閱讀原文或掃描下圖二維碼觀看。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦