search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

BAT可以應用大數據,不能壟斷大數據!

大數據是互聯網時代發展成熟的產物。海量的數據充斥在我們身邊,只是很多人還沒有察覺。但有這樣一些人,他們聽到了海嘯襲來的聲音,率先迎著浪潮而去 。

紫數網的創始人丁齊先生就是這樣的人。本期《數據人物專訪》請他來談談他對於整個大數據產業的看法和見解,還有他的創業經歷。

以下是採訪實錄。

紫數網:先談談您對大數據的見解吧,或者說您怎樣理解大數據?

丁齊這個問題得從兩個角度來回答。一個是大數據是什麼,怎麼理解它;第二個是它發展得這麼快,核心價值是什麼。

對大數據最廣為人知的解釋是4V:Volume——它的規模、Variety——它的多樣性、Veracity——它的真實性,還有一個Value——它的價值① 。而用更為本質的角度來理解大數據,它應該是一個完整並連續的,有效的,同時也是無限增長的數據集群,它的體量和質量決定它的價值大小。

大數據的核心價值是什麼呢?有兩點。一個是它讓人們用全新的眼光去認識這個世界,同時它還是推進商業和科技發展的源動力。

還有一些值得我們深思的問題:大數據發展到今天,從早期的萌芽,到大眾逐漸對這個事物有了認知,再演變到大家都開始熱炒,在任何場景下都可以提到 「概率產業論」。 到了這樣一個地步,我們反而應該回過頭去冷靜地思考一下,如何面對和處理數據。

紫數網:我們現在在網路上看到一個觀點,說傳統數據分析並不屬於大數據。您覺得大數據分析和傳統的數據分析有什麼區別呢?

丁齊:實際上這個區別還是比較明顯的。一般情況下,傳統數據分析是在我們可描述的範圍內去採集相應的樣本,採用的是一種有限的維度和分析方法,在一定的範圍內去分析數據樣本,運用經典統計分析的方法和模型去總結規律或揭示問題的本質。

現在的大數據採用的是一種全新的技術手段和分析思路,為什麼呢?首先它基於實時的、連續的數據集,對這個實時的、連續的、海量的數據集進行探索式的發現,而不是假定一個範圍、一個邏輯,按照因果關係來分析歸納。這是他們的本質區別。

舉個針對在校學生的大數據應用案例。學校要統計全校學生今年期末考試成績的及格、達標和優秀各自占的比重,那我們可以根據設定的範圍,是全市的、全省的還是全國的,類似這樣的範圍去採集樣本;根據這個樣本,再去分析剛剛說的問題。

假設全國範圍內,今年高等教育階段的學生有多少人的成績是達標,有多少人是優秀,沒過關的是多少,統計出一個數據來。這就是傳統的數據統計和數據分析的典型應用。

同樣在這個項目案例中,大數據層面研究的是,全國整體高校學生他們每天在做什麼?學習習慣是怎樣的?他們的偏好是什麼?日常在看些什麼?關注些什麼?他們遇到的問題有哪些等等。大數據分析關注的是更全面,更細節,更貼近用戶本身的特徵和行為。這種數據思維無限接近研究對象的本質。

所以說,大數據跟傳統數理統計所關注的要點和所採用的方法論體系是不同的。前者是基於因果關係在一定樣本抽樣的範圍內進行分析歸納和推理預測,並形成結論;而後者則是通過不斷地跟蹤、積累,基於一個相對完整的全集數據集群中通過探索式挖掘,嘗試發現前所未知的特徵或規律。

紫數網:為什麼想到創立紫數網這樣一個網站?

丁齊:是這樣的,我從事這個領域已經有十年左右的時間。我比較熱衷於數據信息領域的分析研究和應用實踐。從數據裡面,我們可以找到很多有趣的規律、現象,利用這些規律和現象,我們可以為企業和社會創造更多的價值。其實最主要的價值點在於不斷提升決策效率,不斷驅動對未來的洞察,不斷推動我們對管理和決策機制的優化,使整個管理和運營效率能夠不斷的提升,從而在競爭激烈的市場環境下立於不敗之地。這就是我創立紫數網的初衷。

紫數網:您在創業過程中有沒有遇到什麼困境?是怎樣解決的?

丁齊:當然,有。

總結起來主要有兩個問題。第一個是人才,就是團隊問題。在初創階段,和快速成長不斷晉級的關鍵時期,都要面對這個問題。這個問題的核心是思維意識的問題。

這時候應該思考如何擺脫既定思維,能跟上時代的腳步;應該敢於直面當前市場所發生的變化,去理解、洞察、深入到當前的市場中去,主動擁抱市場,才能真實的感受市場 ——市場變了,我們的意識和思維不去發生相應的變化,那我們就等於坐以待斃。

第二個問題是資金問題。這是一個所有公司可能都要面對的問題,尤其對於初創的團隊。說白了,有再遠大的理想、再好的商業模式和團隊,征程中都需要先解決吃飯問題。

在這一點上,我的應對方式是這樣的。首先對內,我們始終強化信心。這個信心來源於我們的初心,那個對我們既定的未來事業的強烈願景,這是我們整個團隊信心的基礎。如果對未來看不清楚,對未來的方向始終搖擺不定,那就談不上什麼信心。信心不牢固,遇到挫折就很容易崩潰。有了信心這個法寶,就相當於掌握了5 成的資本 。

但是光有信心也不行,還得積極擁抱市場和資本。我們是這樣面對投資人的:首先我們有了信心,對未來有了清晰的目標判斷,在此基礎上,高效的執行力比華麗的 PPT 更能有說服力。最終,通過執行力成果贏得資本的青睞和支持,不僅解決眼前的生存問題,極大的提升了競爭實力和執行效率形成創業和資本之間的良性循環

紫數網:您認為大數據行業的發展現狀如何?存在哪些問題?

丁齊:事物的發展都有一個過程,不能一蹴而蹴。當然,大數據的概念從十幾年前被提出來,到現在經歷了好幾個階段,不斷地去完善,到今天為止,我們從實際的市場發展來看,發現大數據走到今天呈現幾個趨勢。

第一,大數據產業整體發展迅猛。從現況來看,大數據行業的發展在方方面面都取得了很大的進展。尤其是隨著移動端、智能端不斷的優化,數據的體量越來越大,增量的變化也越來越快。在以前,一個 PB 的數據可能需要積累很長一個 周期 , 也 伴隨 很大的一筆 投入,一個企業積累一個 PB 的數據可能需要幾年的時間; 但隨著 智能硬體、可穿戴設備,以及工業 4.0 所催生的物聯網的蓬勃發展,一個企業一天 就能 形成 1PB 的大數據,所以說數據的增量變化會很明顯。數據的 存量 會以指數級的速度爆炸式增長。在這樣的大背景下,大數據將會迎來更快、更大的發展。

第二,大數據正在沿著不同的領域、不同的行業縱深發展。比如說,在醫療健康、人工智慧、生物製藥以及金融等領域都有了很深的研究和應用。在金融領域,現在比較熱門的是在區塊鏈和虛擬貨幣的方向不斷發展,也看到了未來巨大的市場潛能。我們看到了這樣一個機會,當然,到現在為止還沒有走到很成熟的商業化階段,但是可以很明顯地看到未來的趨勢。

第三,大數據的商業化訴求日趨緊迫。比如說我們看到很多企業從進入這個行業到經歷前期的困難和挫折的考驗,再到今天商業化的階段,也提出了一些自己的想法;在商業模式的探索上,也呈現了百家爭鳴的局面。這給我們透露出一個信號,這個時代下的大數據企業都在摸索、嘗試如何讓整個產業真正實現商業價值。

在這個過程中,我看到幾個問題。

其一是任何事物想要發展、最終實現商業價值和商業化的爆發所必須經歷的過程——開放。在數據領域裡,一直在提倡開放性、融合,但是一直到今天,我們所希望達到的境況還是沒有達到,離我們期望的那個目標還有很長的一段距離。

所以說在這個過程中我們還有很多問題需要解決,很多課題需要攻克。比如,數據的標準化 , 個人隱私 , 公共安全等。來自不同的場合,不同的維度,不同標準的數據如何建立關聯,如何打通等等。

這些需要有一整套標準和成體系的架構來支撐。而且需要在更高層次上進行統籌、規劃,來進一步實現數據的整合。這是開放性的問題。

其二,隨著現在市場的火爆,大家都有些浮躁。市場在這個領域裡顯得有些急功近利,這個現象也是很明顯的。

一方面大家都熱衷於對商業的挖掘,卻輕視對基礎研究和基數建設的投入。沒有基礎就想獲取商業價值,無異於空中樓閣,這是急功近利的表現,不利於整個行業的發展。

另一方面,大數據領域人才匱乏,同時魚龍混雜,濫竽充數者眾。尤其大數據是新興領域,人才非常重要,也是讓這個領域真正發展的基礎。

大數據領域需要方方面面的人才,包括數據技術、數據分析、數據挖掘、數據應用,還有數據的安全、管理,商業化,運營,市場等。這些都要求從業者具備相應的專業知識和業務基礎。這樣的複合型人才投入到這個領域裡,才能推動大數據行業的發展。現在人才方面的缺口比較大。

其三,就是大數據基礎依舊薄弱。從頂層設計到統籌階段都不是特別完善。我們的規劃落地時出現了很多問題。

比如,在地方上安排了很多試點,但數據是全局性的、完整性的。如果只採用傳統試點的方式去推動、打開的話,有時候是很難見成效的,這也是需要從頂層設計上考量的。企業也是一樣的。

企業參與到數據產業里,也需要考慮如何全盤布局,從更高層次架構,設定一個標準、機制,讓更多的企業可以融合到一起。數據給我的啟示是數據的共生共贏模式,很難想象有一家企業把整個行業、整個領域都覆蓋。這個過程是不可想象的,也是不現實的。

回到問題本身。過去幾十年,互聯網和移動互聯網的發展很大程度上最終是趨於壟斷的。數據時代的到來,我認為初期階段從細分和垂直的方向延伸,最終再走向聯合的過程這個過程需要一些時間。

紫數網:BAT 三家應用大數據廣泛,您對這三家怎麼看?

丁齊:行業內,大家有一個共同的感受,就是數據向著 BAT 三家靠攏,由他們整合相關領域、相關行業的數據,實現局部的聯合。但是我個人認為,整個產業不是靠幾家公司、也不是若干公司就可以支撐起來的,而應該是全局的、系統的組成。

比如說,在未來大數據時代下的市場應該是這樣的關係:在監管層和在基礎投入層,是國家、地方政府和相關的研究機構來參與的,他們涉及到頂層設計,來制定規則;再到具體的執行層面,數據商業化,需要有不同的行業,不同的領域和不同的應用場景下的企業,甚至組織機構,來整合相應場景下的數據資產。

在國家統一標準的體系架構內,進行數據的交換、融通,從而在相關領域裡具有針對性地、更有效率地優化自己的服務。我認為這才是一個良性的、可持續發展的模式。

BAT 三家把我們所有的行業、領域、市場、應用場景都壟斷掉,是不現實的;即便做到了,也不是一個良性的市場格局。長遠來看的話,最終市場的變化還是應該有一個從上到下的全局規劃和生態的建設。

紫數網:2017年,大數據領域會更加熱門,談談您對於這一年大數據領域的發展有什麼樣的看法吧。

丁齊:總體來說有三點看法:首先,我們希望有更好的頂層設計,需要從上到下系統的、全局的、基於整體的大數據產業規劃,並且在框架基礎上出台相應的規則,來推動整個行業的數據流通。我覺得這是一個前提工作。

世界上很多發達國家已經比較領先了,在這方面也有了很多嘗試,而我們國家在這方面走得還比較保守、滯后。如果在下一個大的時代到來之前,我們不能把基礎工作做得更紮實一些、推動得更快一些,我們可能在下一個 DT 時代,仍然處在被動的狀態。這是第一個。

第二個是在整個數據產業的格局上,我們期待著進一步加速融合和整合。剛才我們說,在大的行業上我們需要領域、場景、行業的細分,有專業度,但是在垂直的行業領域裡,會逐漸地形成格局,也可能在某一個領域裡聚攏出一個巨頭。

比如說醫療健康、金融、交通運輸、人工智慧、 VR 、 AR 等等細分領域,逐漸地會出現格局上的變化。在各個細分領域裡,可能會出現一到兩家巨頭,來統領整個行業。這樣也會加速和進一步推動數據的整合和流通。這是一個可以期待的趨勢。

另外,我個人認為在前沿的應用領域裡,尤其是在今年,我們會看到一些新的突破和耳目一新的變化。比如說基於人工智慧的機器人領域,我們會看到更大的成果,在大數據的支撐下,這一方面會迎來高速發展。包括虛擬現實這樣的應用場景,也會取得非常大的發展。

還有無人駕駛、醫療健康、生命科學,這些跟人的工作、生活息息相關的領域將會率先取得突破,因為它們都來自人內在的剛性需求刺激、驅動;而在剛需的刺激和驅動之下,這些領域也會更快速的運用大數據,來 服務於 人類在工作、生活、學習等各個方面的訴求。這是一個良性循環體系 。

所以,最後補充一句:未來值得期待!

①第一,數量(Volume),即數據巨大,從 TB 級別躍升到 PB 級別;第二,多樣性(Variety),即數據類型繁多,不僅包括傳統的格式化數據,還包括來自互聯網的網路日誌、視頻、圖片、地理位置信息等;第三,真實性(Veracity),即追求高質量的數據價值(Value);第四,即價值巨大。

閱讀原文了解更多詳情



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦