search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

知識 | 多「大」才算大數據

剛剛閉幕的2017國際大數據產業博覽會又為火熱的大數據產業添了一把火,博覽會簽約金額達167億餘元,簽約意向金額為256億元左右。這一全球首個以大數據為主題的展會,再一次撩起了大數據的神秘面紗,展示了大數據的大能量,一個通過加工處理數據來創造價值的產業正在迅猛發展。

什麼是大數據?有一個故事,說的是一位顧客訂購披薩時,披薩店可以立即調出這位顧客的許多信息,比如送披薩上門必有的家庭、單位等地址和電話,顧客的消費習慣從而推薦適合他的披薩種類,顧客名下的銀行卡透支情況從而確定他的支付方式,甚至顧客要自取披薩時,還能根據顧客名下車輛的停放位置預估他的到店時間等。

從這個故事,我們可以看出大數據的一些關鍵特徵,比如容量大、類型多、關聯性強、有價值等等。「大數據是以高容量、多樣性、存取速度快、應用價值高為主要特徵的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行採集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。」工信部信息化和軟體服務業司副司長李冠宇介紹。

僅僅規模大不是大數據

大數據,顧名思義,「大」該是應有之義。「大數據的定義最初與容量有關係。」李冠宇分析說,業界有幾種對大數據的定義,其中一個共同點就是數據的容量超出了原有的存儲、管理和處理能力。

正如電子信息產業發展研究院副院長樊會文接受記者採訪時指出的,大數據概念產生就是因為數據量和數據類型急劇增加,以至於原有的數據存儲、傳輸、處理以及管理技術不能勝任,需要全新的技術工具和手段。

信息技術日新月異,大數據的定義也在發生變化。工信部賽迪研究院軟體所所長潘文說,數據即時處理的速度(Velocity)、數據格式的多樣化(Variety)與數據量的規模(Volume)被稱為大數據「3V」。但隨著近幾年數據的複雜程度越來越高,「3V」已不足以定義新時代的大數據,準確性(Veracity)、可視性(Visualization)、合法性(Validity)等特性又被加入大數據的新解,從「3V」變成了「6V」。

對於「多大容量的數據才算大數據」,潘文說,大數據的規模並沒有具體的標準,僅僅規模大也不能算作大數據。規模大本身也要從兩個維度來衡量,一是從時間序列累積大量的數據,二是在深度上更加細化的數據。

李冠宇說,比如一份現在看起來很小的數據,但是縱向積累久了也可以變成大數據,橫向與其他數據關聯起來也可能形成大數據。而一份很大的數據如果沒有關聯性、沒有價值也不是大數據。

運滿滿研究院院長徐強認為,「大」是必要條件,但非充分條件。基於移動互聯網用戶規模紅利,國內平台型企業比較容易獲取大量數據,但數據不是越多越好,無用數據就像噪音,會給數據分析、清洗、脫敏和可視化帶來負擔。

這也正如阿里巴巴集團董事局主席馬雲在某次演講中說的:「很多人以為大數據就是數據量很大,其實大數據的大是大計算的大,大計算+數據,稱之為大數據。」

「水漲船高」的大數據

今年麥收時節,在雷沃重工的全國「三夏」跨區作業信息服務中心,顯示屏的全國電子地圖上有許多大小不一、顏色不同的圓圈,這是每個區域正在作業的收割機。智能化的收割機會自動獲得許多數據,包括機器運行情況、收割量、小麥含水量等,數據傳回後台匯總後,總體收割情況一目了然。

「大數據概念正是來自信息技術的飛速發展和應用,特別是隨著雲計算、物聯網、移動互聯網的應用,數據量迅猛增長。數據來源有兩種,一種與人有關,比如政府、企業等為人們服務時產生的數據;另一種與物有關,在移動泛在、萬物互聯時代,物聯網應用的浪潮將帶動數據量爆髮式增長。」李冠宇說。

這也就不難理解,為何當下數據產生的速度如此之快。正如樊會文所分析的,一方面,信息終端大面積普及,信息源大量增加;另一方面,基於雲計算的互聯網信息平台快速增長,數據向平台大規模集中。

大數據與雲計算、物聯網、人工智慧等新一代信息技術之間相互影響、相互促進、相互融合。徐強說,運滿滿通過車聯網設備和信息平台,每天獲取3TB至4TB的數據,運用先進的大數據演算法模型,實現了智能車貨匹配、智能實時調度等。

樊會文認為,雲計算是硬體資源的虛擬化,而大數據是海量數據的高效處理。簡單來說,雲計算是大數據的基礎,有了雲計算才能大量集中數據從而產生大數據。同時,大數據也支撐了雲計算應用創新,帶動雲計算髮展。

人工智慧的核心在於大數據支撐。圍棋人工智慧程序「阿爾法狗」打敗柯潔,離不開大數據的支持。「大數據技術能夠通過數據採集、分析等方式,從海量數據中快速獲得有價值的信息,為深度學習等人工智慧演算法提供堅實的素材基礎。反過來,人工智慧技術也促進了大數據技術的進步。兩者相輔相成,任何一方技術的突破都會促進另外一方的發展。」潘文說。

核心價值在於應用

剛剛過去的「6·18」再次掀起網購熱潮。網購消費者基本都被精準推送過廣告信息,如曾瀏覽過電飯煲的消費者,很長一段時間內會在登錄頁面后看到各品牌電飯煲信息。

阿里、京東、360等互聯網平台接觸消費者眾多,也因此獲得了很多數據。但是正如精準推送一樣,不對這些數據進行處理、挖掘就沒法產生價值。比如雷沃收割機傳回的數據進行匯總後還要分析處理,從而得出對收割作業乃至整個農業都有意義的結論才是這些數據的價值所在。

「大數據作為重要的基礎性戰略資源,核心價值在於應用,在於其賦值和賦能作用,在於對大量數據的分析和挖掘后所帶來的決策支撐,能夠為我們的生產生活、經營管理、社會治理、民生服務等各方面帶來高效、便捷、精準的服務。」李冠宇強調。

我們正在步入萬物互聯時代。華為預測,到2025年,物聯網設備的數量將接近1000億個。工信部統計數據顯示,目前網民數量超過7億,行動電話用戶規模已經突破13億,均居世界第一。

「全球數據總量呈現指數級增長,企業級用戶擁有的數據量在快速增加。互聯網的社會化生產出巨量數據。」樊會文說。

大數據產業也因此有了穩步增長的基礎。據潘文介紹,2016年大數據核心產業規模達到3100億元,按照工信部今年年初發布的《大數據產業發展規劃(2016—2020年)》,預計到2020年將達到1萬億元的規模。

「2016年,兩批次8個國家級大數據綜合試驗區開始建設,大數據集聚發展布局初步形成,各區域特色化發展態勢初現。以阿里巴巴為代表的大數據企業不斷創新,開源技術成為大數據技術創新和產業進步的重要力量。大數據在金融、電信、交通等行業領域不斷深化應用,催生著新業態,加速著產業升級。」潘文說。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦