我們知道互聯網存在暗網,其實企業數據也存在暗數據。
近日,消息稱,蘋果已經完成了對數據公司 Lattice Data 的收購交易,總花費2億美元,後者20人的工程師團隊已經全部入職蘋果。這家總部位於新澤西州的初創公司成立於2015年,主要業務是處理「暗數據」(Dark Data)。
「暗數據」是什麼?
暗數據是指企業已付費購買、收集以及存儲在各種系統和數據存儲中,但實際上目前並未使用、分析甚至訪問的所有數據。我們可以將「暗數據」視為大數據的子集,它可以包括存儲在 CRM 數據倉庫的結構化數據、日誌文件甚至來自於社交媒體的非結構化數據等所有數據。
什麼樣的數據才稱為暗數據?舉個例子來解釋一下。有估算說一輛自動駕駛汽車每秒會產生 100G 的數據。現在我們無時無刻不產生數據。發信息、跑步、付賬,甚至連坐在家裡什麼也不做也可能會為提供服務的科技公司帶來數據。
其實,暗數據是指那些尚未使用和分析的數據,比如來自日誌文件、社交網路的信息。組織和企業在日常運營中收集、購買和存儲這些雜亂無章的數據,但沒有用於分析或者直接的業務上。
暗數據與數據透明化的區別
暗數據對立面,叫做數據的透明化, 一般我們期望的結果是企業中所有數據,對企業的任何一個參與者--IT、業務、決策、財務--都是透明的,在他們想分析的時候都能找到所需的數據。
在任何企業在發掘數據價值的時候,往往包括三種典型的角色:集成商、IT部門和業務部門。業務部門一般被認為是數據的主人。而「暗數據」除了要啟動業務部門的自助服務的能力,以及啟動IT部門的標準化構建,還有一個關鍵點是啟動可重複利用「暗數據」的流程。
哪些人工智慧大數據公司佔據優勢?
最近,會計師事務所德勤 Deloitte 發布了《2017 科技趨勢報告》中稱,據他們研究與調查得出 8 個科技趨勢將在 2017 年得到飛速發展。而暗數據就名列在榜單。這 8 個新的科技趨勢將在未來 18-24 個月將在企業領域產生巨大影響力。
AI的發展是建立在數據的分析和整合基礎上的,但是目前整個市場有超過80%的數據未被利用開發。如果哪個公司掌握了這些數據,基本就站在AI產業鏈的最前端。
暗數據屬於大數據人工智慧的一種,大數據和人工智慧公司在處理暗數據上面,具有先天的優勢。我們通過A股上市公司數據整理髮現,目前,國內既涉及到人工智慧,又插足大數據的公司有同花順、紫光股份、思創醫惠等公司。
其中,同花順在大數據應用輸出持續加碼, 公司依靠大數據和人工智慧為代表的技術積累,未來在投顧服務平台、機構金融數據服務業務以及投資機器人領域發展空間廣闊;作為龍頭企業,在市場成長期的過程中,市場份額有望不斷提升。