search
經濟日報「六問大數據」,第一個問題就可能把你問住!

經濟日報「六問大數據」,第一個問題就可能把你問住!

生活在當下,大數據

之名如雷貫耳,卻也是最熟悉的陌生人。很多人只知其名,而不知其意。多「大」才算大數據?如何利用大數據賺錢?大數據如何影響我們的生活……這些看似簡單的問題,就像圍繞在大數據之外的一層迷霧,遮住了大數據的廬山真面目。為一探大數據之究竟,《經濟日報》刊發系列文章——「六問大數據」,為大家一解大數據之惑↓

大數據,顧名思義,「大」該是應有之義。「大數據的定義最初與容量有關係。」工信部信息化和軟體服務業司副司長李冠宇分析說,業界有幾種對大數據的定義,其中一個共同點就是數據的容量超出了原有的存儲、管理和處理能力。

正如電子信息產業發展研究院副院長樊會文接受記者採訪時指出的,大數據概念產生就是因為數據量和數據類型急劇增加,以至於原有的數據存儲、傳輸、處理以及管理技術不能勝任,需要全新的技術工具和手段。

對於「多大容量的數據才算大數據」,工信部賽迪研究院軟體所所長潘文說,大數據的規模並沒有具體的標準,僅僅規模大也不能算作大數據。規模大本身也要從兩個維度來衡量,一是從時間序列累積大量的數據,二是在深度上更加細化的數據。

李冠宇說,比如一份現在看起來很小的數據,但是縱向積累久了也可以變成大數據,橫向與其他數據關聯起來也可能形成大數據。而一份很大的數據如果沒有關聯性、沒有價值也不是大數據。

運滿滿研究院院長徐強認為,「大」是必要條件,但非充分條件。基於移動互聯網用戶規模紅利,國內平台型企業比較容易獲取大量數據,但數據不是越多越好,無用數據就像噪音,會給數據分析、清洗、脫敏和可視化帶來負擔。

「大數據概念正是來自信息技術的飛速發展和應用,特別是隨著雲計算、物聯網、移動互聯網的應用,數據量迅猛增長。數據來源有兩種,一種與人有關,比如政府、企業等為人們服務時產生的數據;另一種與物有關,在移動泛在、萬物互聯時代,物聯網應用的浪潮將帶動數據量爆髮式增長。」李冠宇說。

這也就不難理解,為何當下數據產生的速度如此之快。正如樊會文所分析的,一方面,信息終端大面積普及,信息源大量增加;另一方面,基於雲計算的互聯網信息平台快速增長,數據向平台大規模集中。

大數據與雲計算、物聯網、人工智慧等新一代信息技術之間相互影響、相互促進、相互融合。徐強說,運滿滿通過車聯網設備和信息平台,每天獲取3TB至4TB的數據,運用先進的大數據演算法模型,實現了智能車貨匹配、智能實時調度等。

「大數據作為重要的基礎性戰略資源,核心價值在於應用,在於其賦值和賦能作用,在於對大量數據的分析和挖掘后所帶來的決策支撐,能夠為我們的生產生活、經營管理、社會治理、民生服務等各方面帶來高效、便捷、精準的服務。」李冠宇強調。

目前,大數據的金礦還僅是開挖了「冰山一角」。

大數據主要盈利模式圍繞兩方面展開,一是通過直接「搬運」數據賺錢,二是通過數據加工分析盈利。

「大數據的市場規模沒有天花板。」國務院發展研究中心信息中心研究處處長李廣乾認為。不過細想,這正是目前各大企業和資本瘋狂追逐大數據產業的重要原因。

目前,大數據的金礦還僅是開挖了「冰山一角」。從總體規模看,2016年,全球大數據市場規模實現16.5%的增長,預計將連續3年保持增速在15%左右。同時,大數據成為全球IT支出新的增長點,2016年,有近40%的企業正在實施和擴大大數據技術的應用,另有30%計劃在未來12個月內應用大數據。

「說大數據產業是一張畫得很大的餅顯然是片面的。」潘文預測,包括大數據硬體、大數據軟體、大數據服務等在內的大數據核心產業環節,2016年達到3100億元,將在2020年超過1萬億元;大數據關聯產業規模2016年超過5萬億元,將在2020年超過10萬億元;大數據融合產業規模2016年達到3.5萬億元,將在2020年超過20萬億元。

「從大數據核心產業結構看,基於大數據的服務是大數據核心產業的主體,其規模約佔大數據核心產業規模的90%,未來,服務也將是大數據產業的最核心部分。」潘文說。

目前國內大數據公司分為兩類:一類是已有獲取大數據能力的公司,如百度、騰訊、阿里巴巴等互聯網巨頭及華為、浪潮、中興等企業,涵蓋了數據採集、數據存儲、數據分析、數據可視化及數據安全等領域;另一類則是初創大數據公司,依靠大數據工具,針對市場需求,為市場帶來創新方案並推動技術發展。

不同的大數據公司,盈利模式也不相同。如果把大數據產業比作房地產開發,那麼海量數據就是地產開發時的土地資源,數據挖掘開發就是地產搭建蓋樓。大數據主要的盈利模式也是圍繞這兩方面展開,一是通過直接「搬運」數據賺錢,二是通過數據加工分析盈利。

「我們就像一個自來水廠一樣,用戶要你提供乾淨的自來水,對方可能是酒廠、飯店、飲料廠,他把你的水做成飲料或酒。」聚合數據就是一家主要依靠為客戶提供數據盈利的公司,公司創始人左磊對其商業模式作了一個形象的比喻。

在開發APP應用過程中,左磊發現客戶對於數據的需求非常大,但他們本身卻沒有能力去做這些事情。聚合數據的主營業務,就是整合市面上有價值的數據源,從車輛違章信息、航班火車查詢、全國加油站實時油價,到在線試題、電影、股票,做成標準化的API(應用程序編程介面),開放給開發者、企業及微信公眾號用戶等使用,為他們免除數據收集、維護等環節。簡言之,聚合數據是一家數據源公司,充當的是數據「搬運工」的角色。

此外,如果說搬運數據是秀肌肉的「體力活」,那麼分析數據並提供解決方案就是拼智商的「腦力活」,相當於把收集來的數據「消化」「利用」好。直接售賣數據是比較底層的盈利方式,而對數據進行處理加工則在商業模式上具備更多的想象空間。

大數據對傳統產業的改變不只是某個環節,而是從設計研發、生產管理到售後維護的全流程。

零售巨頭沃爾瑪每天都要處理龐大的數據信息,所有店面的銷售情況都實時反映到大數據中心,通過對比分析可以準確發現隱藏的問題。沃爾瑪相關負責人表示,運用大數據工具之後,出現問題到解決問題的時間從兩到三周縮減為20分鐘。

零售業運用大數據調整銷售策略,製造業運用大數據加強售後維護,農業運用大數據制定收割路線,電信業運用大數據加強精準營銷……顯然,大數據對傳統產業的改變不只是某個環節,而是從設計研發、生產管理到售後維護的全流程。

「大數據的高容量、多樣性、存取速度快、應用價值高等特性都有助於傳統產業轉型升級。」潘文接受記者採訪時表示,大數據是創新發展的資源,大數據資源的開發也要經歷採集、傳輸、儲存、梳理、分析等過程去形成軟體和個性化解決方案,然後應用到相關的領域、行業和企業。而大數據的實時、感知和預測等特點確實可以在企業降低成本、縮短生產周期、提升效率、細分產品定位、優化流程和決策等方面扮演重要角色。

目前,商業、金融業、製造業等傳統行業都有成功的大數據應用。其中,「零售、媒體、能源、電信等行業應用大數據做得比較好。」潘文解釋說,前兩者是因為在消費前端,加之「互聯網+」大潮帶動,大數據的價值很容易體現出來;后兩者則是因為本身在國家推進產業發展時就一直比較重視信息化建設以及後來的智能化升級改造,大數據的應用水平自然水漲船高。

「製造業是大數據應用的主戰場。」李冠宇認為,大數據能推動製造業在更大範圍、更深層次實現更有效率、更加精準的資源配置,加速驅動製造業生產、管理、營銷模式的全面變革,顯著提升製造業發展的質量和效益。智能製造是《製造2025》的主攻方向,而大數據正是智能製造的重要內容。

「目前,製造業應用大數據的水平並不高。」潘文坦言,大數據從消費端向生產端滲透是一個漸進的過程,此外製造業本身各行業之間智能化水平差異較大,這兩方面都直接影響到大數據的應用水平。

「舉一個簡單的例子,日本工廠的一條生產線有上千個感測器,國內企業則只有幾百個。少這麼多不是為了省錢,而是因為國內企業不知道還能在哪些地方放感測器。由此可見製造工藝水平越高,對精準操控的要求就越高,對感測器的要求也就越多。」李冠宇說。

由此可見,大數據要與傳統產業更好地融合,關鍵還在於產業本身的發展和應用。比如,最靠近消費者的服務業把大數據用得最好。潘文認為,服務業成功應用大數據的經驗可以總結為3點,一是從過程看,大數據實現了要素間的互聯互通和綜合集成,借鑒到製造端就是現在大家熟知的信息物理系統。二是從要素看,大數據平台搭建推進了要素的優化整合和高效配置,借鑒到製造端就是工業大數據。三是從決策看,大數據成為精準投放決策的重要支撐,借鑒到製造端就是商業智能。

隨著大數據的廣泛應用,這個世界越來越透明,人們就像生活在玻璃魚缸里。

對大數據時代,當下有一個形象又略帶幽默的說法:隨著大數據的廣泛應用,這個世界越來越透明,人們就像生活在玻璃魚缸里。

在這個時代,每個人都是大數據的生產者,數據讓孤立的個人不再神秘。隨著智能終端的發展,人們的每一個行為都可能產生數據,並且被記錄下來。比如,每一次心臟跳動、生活中的每一筆花銷、每一次外出旅行等等。

「大數據技術現在已經被應用在了我們生活當中的很多地方,其中包含了我們日常的衣食住行。」潘文表示,不管是在工作場所、購物娛樂場所還是家中,人們都能夠隨時隨地發現大數據帶給生活的改變。

目前,大數據在電子商務領域的應用最廣,成為大數據最成熟的應用模式。京東通過建立PB級大數據平台,將每個用戶在其網站上的行為數據進行記錄和分析,提高與用戶的溝通效率、提升用戶體驗,實現了向不同用戶展示不同內容的效果。

「利用大數據,還可以通過分析預測出行交通規律,指導公交線路的設計、調整車輛派遣密度,進行車流指揮控制,及時做到梳理擁堵,合理緩解城市交通負擔。」李冠宇說,比如,滴滴出行通過掌握的用戶打車記錄、司機行車軌跡等交通大數據,可以科學實現運力調度,精確匹配乘客和司機,優化路徑,減少擁堵。

與民生福祉密切相關的健康醫療領域也在逐步應用大數據。李冠宇透露,部分省市正在實施病歷檔案數字化,配合臨床醫療數據與病人體征數據的收集分析,用於遠程診療、醫療研發,甚至結合保險數據分析用於商業及公共政策制定等等。

大數據給人們的生活帶來了便利,但在「魚缸生活」中,每個人都赤裸裸地暴露著,從衣食住行到醫療信息,無一不被外界掌握,一旦被不法分子或別有用心的人利用,都將帶來巨大的威脅。可以說,大數據對人們的隱私權帶來嚴重挑戰。

李廣乾說,我們通常將信息安全受到威脅的情況分為兩種,一種是系統被黑客攻入、被人為破壞,無法正常運轉;還有一種是個人隱私泄露,給個人帶來很大的困擾和危險。保護個人信息安全,一是要提高個人信息自我保護意識和隱私意識,謹慎對待信息採集等;二是要規範數據採集、使用部門的行為,嚴格管理,杜絕信息被盜取、泄露;三是要完善相應的法律法規,對罔顧個人信息安全的行為進行嚴懲。

大數據產業是新興產業,和世界各國都處於起步階段,綜合排名缺乏統一標準。

在許多垂直領域,的大數據核心技術處於全球領先。

大數據在世界上處於第幾方陣?對此,潘文表示,大數據產業是新興產業,和世界各國都處於起步階段,綜合排名缺乏統一標準。從大數據產業收集端、處理端和應用端來看,在收集端和應用端全球領先,在處理端核心技術方面還有差距。

「各個國家在大數據方面的優勢各有不同,目前還沒法評判誰做得更好。」徐強表示,比如,日本在醫療交通方面做得不錯,歐洲在數據保護方面領先,新加坡在電子政務方面獨樹一幟。而即使是大數據核心技術比較領先的美國,在智慧物流、移動支付等部分垂直應用領域也遜色於。

從大數據核心產業結構來看,服務是大數據產業的最核心部分。全球市場數據分析服務佔整體收入的47.6%,而國內市場數據分析服務在整體收入中佔比卻比較低,主要企業仍停留在前期的基礎軟硬體設施投入和部署階段。樊會文表示,從這個對比可以判斷,國內大數據市場雖然已經進入快速增長通道,但仍處於增長的早期階段。

「大數據對世界的貢獻主要是三點。」潘文分析說,一是引領大數據的創新應用,特別是在消費領域;二是互聯網公司、初創企業引領技術創新步伐,特別是語音識別、圖像理解、文本挖掘等方面已湧現出明星企業;三是已成為產生和積累數據量最大、數據類型最豐富的國家之一。

「在大數據應用方面處於世界前列,特別是在服務業領域,蓬勃發展的電子商務衍生出一系列基於大數據的互聯網金融及信用體系產品,互聯網創新應用普及速度非常快。」潘文說。以互聯網金融領域為例,螞蟻金服推出了芝麻信用,其芝麻分來自淘寶、支付寶的數據佔30%-40%。通過綜合考慮個人用戶的信用歷史、行為偏好、履約能力、身份特質、人脈關係等信息,直接與其信用掛鉤,準確率非常高。

與世界各國相比,大數據體量位居前列。大型數據中心跨地區經營互聯網數據中心業務的企業已達到295家。李冠宇指出,目前網民數量超過7億,行動電話用戶突破13億,均居全球第一。已是世界上產生和積累數據體量最大、類型最豐富的國家之一。

在許多垂直領域,的大數據核心技術處於全球領先。比如在智慧物流領域,就比美國發展得好。」徐強表示,調研表明,菜鳥網路、運滿滿等企業的智慧物流建設,通過為貨主和司機提供實時信息數據匹配,可以降低物流運價5%至10%,腳踏車運行效率可以提升30%以上,降本增效效果顯著。

潘文認為,大數據產業發展將迎來「黃金期」。隨著國家大數據戰略配套政策措施的制定和實施,大數據產業的發展環境將進一步優化,大數據的新業態、新業務、新服務將迎來爆髮式增長,產業鏈進一步成熟和擴張。

儘管與發達國家相比,大數據發展還存在數據資源開放共享程度低、技術創新與支撐能力不強、大數據產業支撐體系不完善等差距,「但要發揮出市場規模大、應用需求旺的優勢,以企業為主體集中攻克大數據關鍵技術,全面提升大數據的資源掌控能力、技術支撐能力和價值挖掘能力,加快邁向數據強國。」李冠宇說。

數據孤島林立、融合困難,已經成為政府與企業面前的首要難題。

如何處理巨量數據是大數據產業面臨的首要技術問題。

人才不足限制了大數據產業創新發展的成效。

「第一個問題就是沒數據,理論上我們有很多數據,但實際做數據分析會發現非常困難。」科學院院士、北京大數據研究院院長鄂維南表示,數據孤島是一個嚴重的問題,不同部門的數據儲存在不同地方,格式也不一樣。大數據最高的層次就是用數據來形成智慧,使得社會各方面可以運轉起來。做數據分析先要整合數據,這本身就是研究的困難。

由於政府部門之間、企業之間、政府和企業間信息不對稱、制度法律不具體、缺乏公共平台和共享渠道等多重因素,導致大量政府數據存在「不願公開、不敢公開、不能公開、不會公開」的問題,而已開放的數據也因格式標準缺失無法進行關聯融合,形成孤島。

對於如何打通數據孤島,潘文建議,要建立完善大數據發展協調機制,加快政府數據開放共享,穩步推動公共數據資源開放。同時,統籌規劃大數據基礎設施建設,推動制定公共信息資源保護和開放的制度性文件,並加強大數據標準化頂層設計,逐步完善標準體系。

在數據共享的路上,2015年成立的貴陽大數據交易所已經做出了成功的嘗試。王叄壽表示,若想打通城市現存的信息壁壘,就要讓城市多方資源聯動起來,搭建城市數據共享的平台,從而激活大數據價值,充分發揮數據資源整合的優質效應,用信息化手段輔助科學決策。

即便解決了數據共享問題,數據可供隨時取用,數據的採集和分析仍是主要挑戰。微軟大中華區董事長兼CEO柯睿傑認為,數據智能並非那麼觸手可及。大數據來源眾多、數量巨大、形式各異,要從中獲得一目了然的信息,就需要真正高效、可靠的數據管理和分析平台。

如何處理巨量數據是大數據產業面臨的首要技術問題。鄂維南表示,「的數據體量特別大,比如,的視頻比任何國家都要多,這些數據儲存困難,需要用的時候往往就沒了」。再以基因測序領域為例,每年新增的基因組測序原始數據超過20PB(1PB相當於100萬GB),面臨著數據量大、數據處理流程長等技術挑戰。

另一方面,數據分析本身也是一個難題。大數據中,絕大部分屬於非結構化的數據,它們大量存在於社交網路、互聯網和電子商務等領域,這些數據的不確定性表現在高維、多變和強隨機性等方面。股票交易數據流就是不確定性大數據的一個典型例子。這些都需要通過包括數學、經濟學、社會學、計算機科學和管理科學在內的多學科交叉來研究和討論。

此外,人才不足限制了大數據產業創新發展的成效。在高端人才稀缺的現實情況下,企業多選擇從海外和傳統行業挖掘跨界人才,但仍然無法滿足國內市場的大量需求。針對大數據人才供應不足的現象,各種培訓機構和各大高校也開始強化大數據人才的培養。但培養大數據人才需要時間,在短期內對於大數據領域的高端人才仍然會呈現出供不應求的現象。

對於大數據人才建設,潘文表示,要建立適應大數據發展需求的人才培養和評價機制,並建立健全多層次、多類型的大數據人才培養體系。同時,還要完善配套措施,培養大數據領域創新型領軍人才,吸引海外大數據高層次人才來華就業、創業。

其他人都在看

本文由 一點資訊 提供 原文連結

寫了5858694篇文章,獲得23211次喜歡
留言回覆
回覆
熱門推薦
精彩推薦