來參加微軟和清華的數據大賽,預測學科發展趨勢,贏取20萬獎金和神秘禮物!
掃描圖中二維碼,或點擊文末「閱讀原文」瀏覽比賽詳情
聯合組織:清華大學、微軟、人工智慧學會、IEEE Computer Society、工程院知識中心、清數大數據產業聯盟(微信公眾號「TH數據派」:ID:datapi)、華章圖書、Paperweekly()
全世界有多少科研工作者?
1億人。
這些學者一共發表了多少篇論文?
3億篇。
這些論文中,被語義標註的有多少?
只有3%。
論文數據囊括了大量的知識,隱含了科技的進步和人類發展的趨勢,如果可以更好地利用這些數據,可以更深入地了解人類知識的進展和邊界。
最近,微軟和清華大學,聯合IEEE 計算機協會、工程院知識中心、科學院文獻情報中心、人工智慧學會,以及IEEE 代表處等機構。舉辦」2017 開放學術精準畫像大賽「,尋找數據分析高手。比賽從 9 月 18 日正式啟動,在 9 月 14 日比賽結束前,你可以隨時參賽。
這是研究機構首次開放如此規模的學術標註數據。同時,主辦方還準備了約¥20萬的總獎金以及來自微軟的神秘周冠軍禮品。
倘若獎金什麼的不足以打動你,那麼有機會接觸到那麼多標註好的學術數據,來分析匯聚人類智慧最前沿的數據吧!
聽起來是不是有點酷?
下面是比賽的詳細介紹。感興趣的同學,趕緊點擊文末」閱讀原文「進入大賽官網報名吧!
賽題描述:
參賽選手根據學術數據挖掘系統AMiner.org和Microsoft Academic Graph提供的數據集,提取學者的個人描述信息,分析學者的研究興趣,以及預測學者的論文引用情況,從而更好地面向學術界提供專家信息、評估學者研究成果、介紹科學研究進展、展示學術發展動態。任務具體描述如下:
任務1:學者畫像信息抽取
學者畫像信息具體包括學者的主頁地址、性別、職位等。隨著互聯網越來越普及,與學者相關的網頁的數量和內容的豐富度和複雜度都大大增加,其中包含了學者的大量冗餘信息,通過整合互聯網上多種來源的學者數據,採用合適的機器學習模型,獲得學者的精準信息是一項潛在有效的學者畫像技術。
任務2:學者興趣標籤預測
研究興趣是學者畫像的重要組成部分,其不僅是學者本身的研究心得或研究拓展方向的集中體現,也能從中窺視不同背景的學者對研究領域熱點或學科研究趨勢的關注度、敏感度的集體反映。與學者畫像信息抽取類似,通過整合互聯網上的大規模多源信息,可以對學者的研究興趣進行判斷。
任務3:學者未來影響力預測
學術影響力用來衡量學者在專業理論及技術方面的影響,常用的評價指標有論文被引量,期刊影響因子、作者H指數等,其中論文被引量是一個重要而直觀的指標。本任務的目的是基於學者當前的相關學術數據預測其未來某段時間內的總論文被引量。
賽制流程:
7 月 18 日 : 比賽開放提交答案入口
7 月 18 日- 9 月 14 日:比賽期(比賽期間可隨時報名和提交)
9 月 14 日 23:59 (UTC時間):發布最終測試集。
9 月 15 日 23:59 (UTC時間):測試集結果提交截止。
9 月 16 - 20 日:公布比賽最終排名
10 月 15 日(待定):頒獎活動
獎項設置:
一等獎 1 支隊伍,獎金:¥1萬美元(約¥67550)
二等獎 2 支隊伍,獎金:各5000美元(約¥33750)
三等獎 4 支隊伍,獎金:各2500美元(約¥16875)
比賽期間所有的周冠軍隊伍都將獲得由微軟提供的小禮品,以及由大賽組委會頒發的獲獎證書 & 技術圖書哦~
比賽討論:
您可加入比賽的微信討論群。加入微信討論群請添加請添加「數據競賽小助手」(ID:shujujingsai)為微信好友並在申請時備註「機構+姓名+微軟杯」,由小助手統一添加進群。如果備註不正確申請不會被接受。
參賽方式:
點擊文末」閱讀原文「或掃描下方二維碼可直達賽事頁面,註冊網站 -下載數據,即可參賽。
友情提示,因涉及到數據下載,強烈建議大家登錄 PC 頁面報名參加~~
點擊「閱讀原文」報名