search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

專訪神策數據 CEO 桑文鋒:在數據私有化領域,如何做到「特立獨行」?

編者按:本文來自於「互聯網數據官」(),作者宋星,36氪經授權發布。互聯網數據官(iCDO)推出了一款與最優秀的互聯網數據公司的掌門人對話的欄目,分享行業的觀點、對數據的理解、對客戶的觀察,以及對增長的思辨。本次採訪的是神策數據的創始人兼CEO,桑文鋒先生。

關於神策數據的「特立獨行」

iCDO: 之前你是百度的技術高手,一直在為百度的底層數據提供技術服務,什麼原因要從百度離開,並進而創立了自己的大數據公司呢?

桑文鋒:我在百度工作八年,從2007年進入百度到2015年離開。這八年裡有七年多的時間,都是在做數據這塊的工作,所以對數據非常有激情,也很有感情,更有「感覺」。任何老百度人在選擇離開百度的時候一定是非常糾結的,我也不例外,畢竟是百度給了我們一切。不過最終考慮離開百度有兩個原因,一是仍然希望能夠有機會去嘗試不同的事情,希望能在不同的領域去發掘自己的技術能量和潛力;另一個原因是我始終認為數據是最有價值的資產,所以覺得自己何不做一些能夠讓數據直接產生價值的東西。

其實最初還是想利用數據做一些2C的事情,並不是一開始就想做2B,因為覺得2B主要是靠關係去拿客戶,我們做技術的哪兒有關係呀。所以一開始完全考慮的是做2C這塊。

正好那個時候,我的一個發小給我打電話,問我要不要一起做一個相親網站,他看好相親這個事情,因為今天「光棍」和「剩女」確實很多。我從數據的角度上想,相親也不錯呀,做一個相親大數據,用數據技術解決匹配問題,是一個不錯的方向。

不過,後來仔細想,這個市場不夠大,就算我做得很成功,做成TOP1又能怎麼樣,估值也不過1.5億左右,不是一個大事感覺。

包括創業過程中和一些投資人碰撞,和我們幾個小夥伴碰撞,決定還是要做一個能夠讓數據直接帶來效果的產品。我們經過了非常多的論證,也研究了各種可能性,最終歸結到一點,我們決心做一個可以私有化部署的數據產品,一個可以私有化部署的互聯網用戶行為採集和分析產品,或者可以簡單的理解為,我想做一個私有化部署的Google Analytics。

為什麼這麼定位?因為GA畢竟是統計分析領域做的最好的,市場份額至少是最高的。但為什麼我們跟GA不一樣,我們要強調私有化部署呢,那是因為2014年我在百度的時候,曾經做了一個項目,就是要把百度的這種大數據能力輸出到外面的一些企業去,但在溝通的過程中我發現,我們想讓這個客戶把它的數據放到百度的平台裡面,其實很難說得動,比如有一些銀行啊,還有一些大企業都不願意將自己的數據納入第三方。那時我就想,如果我以後出去創業,一定要支持私有化部署。

iCDO: 私有化部署很顯然是神策數據與其他同行的一個顯著性的差異點。互聯網數據官的讀者朋友們也有人專門建議我問文鋒,你們跟其他類似廠商(比如GrowingIO,諸葛IO等這樣的公司)有什麼顯著的區別。很顯然你的答案肯定會是私有化部署。不過,私有化部署並不是大家的共同選項,反而是神策的一個「特立獨行」之舉。企業數據系統的私有化部署,其實是有很多困難的,比如,部署本身很難,此外,部署之後的維護、升級,用戶的靈活性等,都有很多難關要克服。神策為什麼有「勇氣」瞄準私有化部署領域呢?

桑文鋒:是的,私有化部署並不是一個普遍選項,所以我們才更要選擇這麼做。當然,我們不是意氣用事,我們做了很多分析,而且也結合了我們自己的很多優勢。

14年底15年初,SaaS是非常火的,因為它有兩個明顯的好處:維護成本低、掌握企業數據。但我對這個的看法不同:首先,維護成本是能用技術手段來解決的,包括如何更好的維護分散式這種複雜的系統,並讓其健康的運行,這些對我和我們這個團隊來說不是一個大的問題;其次,就掌握客戶的數據這點來說,在國內大家對數據安全還是比較顧慮的。你拿到客戶的數據,客戶難道就不知道很重要嗎?我們還是要從客戶的需求出發,提供私有化部署,客戶不用擔心我會出賣他們的數據,因為我們不會獲取其用戶的數據。

我們從成立以來定位就是做私有化部署,私有化部署的客戶在我們客戶裡面佔2/3。像中郵消費金融、聚美優品、秒拍、小黃車等等,都是我們私有部署的客戶,其實這些標杆類的客戶一般選私有化比較多。

iCDO: 有沒有友商跟進呢?如果他們也在做私有化部署呢?

桑文鋒:我是這麼看這個問題的,就是一個策略如果有效,對手不可能不跟,但是私有化部署對技術的挑戰還是很大的。舉個例子,SaaS方式就像依山建一所房子,然後客戶要求在平地上再建一套房子,怎麼辦?你直接把那依山而建的搬過來,最後可能就是個缺胳膊少腿的房子,這裡的問題是維護代價就比較大。所以對原本只做SaaS要轉成私有化部署的情況下,技術上本身的挑戰就很大,而神策因為一開始定位就是私有化部署,從開始就建了帳篷,不管在山上搭還是在哪裡搭,都可以很好地去支撐。

所以從這一點上來說,即使有競爭對手也去支持私有化部署,我覺得跟我們這種方案的成熟度一定不同。比如部署周期,我們部署周期會比較短,單機版遠程部署僅需30分鐘左右,集群版也僅是1~3個小時。另外,維護其實是一個更大的環節,我們部署方案出問題的概率非常低,即使出了問題,我們也有完善的處理方式。所以看似簡單的一個私有化部署,想要真正把它玩轉,要把這些分散式的服務做好,這本身就是神策的一個優勢。

iCDO: 但關於私有化部署,爭議是很多的,所以,您是否也認同業界所說的私有化部署的弱點?

桑文鋒:私有化部署總體來說維護成本會比SaaS高,但我覺得最後是要看投入產出比的,你只要能夠划得來就可以了,同時,我們神策數據不追求低價,我們更認同711便利店的理念,就是在相應價格上的物有所值;其次,私有化部署無法拿到客戶的數據,但是這一點對神策的定位來說並不是問題,因為我們立足幫助客戶打造數據根基,而非獲取客戶數據。

iCDO:可是私有化部署畢竟比SaaS要複雜,這是物理決定的,你得在客戶的環境中一個一個去做,很難規模化。你們有什麼更好的方法去解決這個問題?

桑文鋒:是有更好的辦法的,這裡包含兩點:一是產品和部署環境要標準化,如果你去部署的每家都是獨立的一套,並且有很多定製化的需求,那你處理起來每一個都是獨立的樣本,維護代價就非常大,所以我們要求產品和環境的標準化,後續的維護就可以標準化的處理;

二是我們本身系統裡面有專門的自動化運維繫統,是中間很重要的一個環節。其實對於大數據系統,很多時候大家僅關注數據「如何采,怎麼傳,怎麼存,怎麼查,怎麼可視化」這五層。但實際僅有這五層還不行,額外還得有三塊:監控、元數據、調度器,要把這些東西結合起來才能穩定地運行,比如某一塊是數據採集出了問題,還是傳輸出了問題,還是查詢出了問題,並且它有問題的時候可以自動恢復等等。所以這些東西真正做好才是維護性比較強的。

iCDO: 每個企業的生產環境和營銷環境可能都不盡相同,既然要做私有部署,那麼意味著肯定存在相當繁重的定製化工作吧?

桑文鋒:這裡面就是定製化的問題,首先我不相信一個SaaS類的軟體或是一個分析工具能夠解決你所有的問題,我甚至覺得SaaS類和分析工具僅能解決一少部分問題,還有許多是需要個性化獨立處理的。神策提供的是PaaS+SaaS模式的服務,我們將數據底層建好后,客戶可以在此基礎上做二次開發,並且我們面向的客戶大都是互聯網公司,本身就有開發能力,做二次開發並不難,這也就很好的解決了個性化需求的問題了。

神策希望幫助客戶建立數據根基,用windows做類比來說,windows作為一個操作系統做了兩件事情:一是對各種硬體、CPU、內存、磁碟、網路等的管理,二是它提供了一層API,可以讓第三層應用層開發QQ、outlook等應用。

對比神策來說,首先是把各種各樣的數據源採集回來,建好底層;其次提供PaaS平台方便用戶二次開發;第三層就是各種應用了。大家普遍看到的神策分析的部分,只是一種應用,基於這個PaaS平台同樣可以去做推薦,去做推送,去做風控或是做其他挖掘都是可以做的,從這三層去考慮,對於windows做類比的話就更能清楚神策這個價值了。

iCDO: 為了能夠實現這種私有化部署及定製,神策肯定需要深入客戶的業務,對客戶的業務進行梳理之後才能進行定製吧?如果是這樣,這種深入業務進行梳理工作的一般周期大約會是多久?

桑文鋒:是的,肯定要對客戶的業務進行深入了解和梳理。時間周期一般在半天到兩天左右。因為互聯網產品還是會垂直分類的,比如互聯網金融是一類,電商是一類等等,每個類別下都是有共性的。如果沒有共性,每一個都是獨特的,那這個代價實在是太大了。一旦掌握了這種共性,我們能對每一家都是獨特的,但對我們自己來說,是可以更高效的去解決問題。

所以進一步說,如果每一家都建自己的數據團隊,然後去摸索,其實我認為並沒有發揮出團隊的威力,這也是我去年的時候寫過一篇文章,就是在大數據時代,每家都需要一個大數據部門嗎?其實是不需要的,這就好比在電氣時代,每家都要做個發電廠嗎?其實也不需要,你可能更多的時候需要的是能夠把電用好的一個人就可以了。

關於行業和客戶

iCDO: 你怎們看待今天的企業在數據使用上的痛點?比如,大家現在對於數據普遍比較重視,但是實際上你會發現很少有企業真正很好的利用起來了數據。

桑文鋒:這裡需要從互聯網公司和傳統公司兩個角度去看:互聯網公司一是採集數據的方法有問題,對數據源的重要性意識不夠,比如我們最開始的時候不管數據源頭是怎麼樣的,然後通過在中間做複雜的ETL,再建立數據質量管理,等我們做了幾年之後發現這種思路有問題,不管怎麼做就做不好,所以我們痛定思痛,這也是我在百度很重要的一個心得——就是數據源很重要,我們需要從源頭盡量讓數據規範標準起來。比如之前我在百度做的數據採集審核系統,每次變更一個欄位或變更一個什麼東西都能去審核管理起來,從源頭去結構化,讓源頭不放水,源頭放水了後面就很難做,這是第一個數據源的問題;

二是數據採集的優先順序問題,數據工作在團隊內的優先順序不高,數據團隊推不動工程團隊,比如數據採集需要工程團隊和數據團隊打配合,往往工程團隊忙著迭代功能,數據的優先順序就會被弱化或是應付了事。所以我們現在跟一些客戶去溝通的時候,一般盡量找那個能夠調動工程團隊資源的人,因為只有他認可,才能把這個事情做好。

從傳統企業來說,同樣歸結為兩個問題:一是IT化程度不夠,IT化是數據化的前提條件,數據沒有採集的溫床,也就沒有根基;二是數據意識不強,雖然認識到了數據的重要性,但在實際工作中,仍然憑感覺做事。

iCDO: 所以是不是其實客戶可以分成兩類?一類就是他已經意識到數據的重要性,也懂得利用數據去提升效率和效果,但是缺少好的解決方法,即意識已經到位,能力有所欠缺;另外一類是可能連意識都還沒有到位,希望通過大數據解決所有問題,並希望儘快看到高收益高回報?

桑文鋒:我是這麼看的,越初級的客戶越會是第二類。認知比較淺的話,要的東西就會越飄,越要求高大上。就像現在人工智慧比較火,越是不懂的可能要的越是天花亂墜,懂行的更清楚如何可行的看某一個問題,部分利用人工智慧,部分利用正常的IT系統,按人配合去把它做好。所以從這點上來說,我覺得如果一個客戶他要的很荒唐,這也是需要我們這樣的數據從業者去引導他們的地方,我們不能被客戶牽著走,我們本身是需要普及整個數據化進程的。這種數據化進程是一步步往前走的,但是現階段底子還是很差,所以這也是我們為什麼將「建立數據根基」作為神策定位的原因。

iCDO: 神策現有的客戶中,哪些會比較接受數據驅動運營的理念?

桑文鋒:目前的客戶可以分成三類公司:一類是BAT還有矽谷回來創業的公司,這種公司就是在挑工具,只要工具能夠解決問題就可以,不需要講理念;第二類是其他類型的創業者,之前沒有數據驅動的理念,這個時候就需要我們去灌輸整個體系了,包括他在實際工作中應該關心哪些指標,應該如何做分析等等;第三類就是互聯網+企業,這些企業許多時候是高層站得很高,但是一線員工的意識和能力比較有限,這個時候我看到的這種特徵是自上而下來push的,所以導致的結果就是執行周期比較長,當我們遇到這樣的客戶,會進行更多的培訓,進而培育市場。

iCDO: 現在很多用戶會認為分析不能解決實際問題,現在更需要能夠落地要執行甚至幫你執行的解決方案,您怎麼看?

桑文鋒:這個問題特別好,其實這是一個惡性循環,分析不能解決實際問題的最主要原因就是數據採集沒做好,那後面的環節就都受影響了。許多公司在做數據分析時的一個很大的問題就是靠需求驅動,比如老闆要一個數據,分析人員就處理一個數據,下次要了另一個數據,就再單獨處理,根本沒有數據體系的建設。

我們可以從四個方面來考慮這個問題:首先,我們要做好數據採集,這是根基;其次是做好數據建模,比如神策一直強調的一個模型,就是event-user模型,其實就是最重要的兩張表,一張表記錄用戶做了什麼,另一張表記錄用戶有什麼屬性;三是各種分析方法,比如漏斗分析等,界面上點選幾下就可以實現,而不是讓工程師花數周時間專門開發;最後是指標體系,圍繞產品從拉新、留存、變現等各個角度來看,我們需要關心哪些指標。所以我覺得真正去建好一個數據體系,應該分成四層,即「採集、建模、分析方法、指標體系」。

iCDO: 您一直提到神策的願景是幫助企業建立數據根基,這裡其實很大程度上是對數據源的有效把控,但數據源在採集的時候,該采什麼數據或者哪些數據是對公司有用的,這些問題神策是怎麼考量和解決的呢?

桑文鋒:我對數據有一個看法,數據這個事情想要做好是需要經驗的,沒有經驗真的是很難做好,因為會不斷的踩坑,比如哪些欄位要採集,哪些不要采,然後該用什麼系統,涉及哪些系統組件,其實都是一個一個坑。即使你想好了,然後推動業務部門去配合你,工程部門配合你開發,業務部門配合去用,其實這裡面都是一系列的坑。

這也是神策的一個價值,神策是一個80%產品+20%諮詢,我們有一個強大的分析師團隊,還有一個客戶成功團隊,基本上就是分析師團隊在部署之前會幫助客戶去梳理他的業務,然後圍繞業務裡面有哪些關鍵的行為事件,事件裡面涉及哪些關鍵的維度,再去決定部署,只有這樣的話,才能把這個底子打好,否則你憑空產出分析或工具去用,可能也只有10%的功能客戶會埋單。

iCDO: 人很著急,花錢買了你神策的東西,或是Adobe的東西(比如AdobeOmniture等),就希望能夠立即看到效果——能夠馬上看到企業組織在工作流程或方式上的改變;另外一種心態則是,我花了5萬元買了你的產品,你的產品必須給我帶來超過50萬額外的銷售作為回報,否則你的產品就是「忽悠我的錢」,您怎麼看這個問題?

桑文鋒:我是這樣看的,確實有一個大的背景,就是的人力便宜,在這種情況下,大家許多時候能用人頂上,幹嘛還要用你這個第三方工具呢,還得額外花費成本,然後大家就不願意為效率付費,這是一個問題;另外一個問題是流量很便宜,許多時候獲取流量太容易了,粗放型的也能活得很好。

但現在我覺得這兩個條件都不具備了,已經被打破了,首先人力變得越來越貴,就拿咱們數據分析這個領域來說,招人非常困難,很難招到合適的人選;其次,流量紅利沒了,做廣告帶來的收入又不是純利,虧多少就是一個問題。所以從這些因素就逼迫著互聯網企業要精耕細作,要挖掘好已有的用戶群,並想辦法把它利用好。

所以在我看來,互聯網統計分析其實經歷了三個階段:最開始是流量階段,這個階段大家只關注訪問量就夠了;到了第二個階段,是用戶階段,我們開始關心DAU、MAU等一類指標,但仍然不需要深挖;而現在我覺得已經是第三個階段,就是訂單階段,我們要關心一個用戶怎麼轉化進來的,來了之後怎麼去盤活他,所以整體數據分析的需求都變強了。

同時,確實如你所說,我們希望儘快看到效果,這也是一種趨勢,而且我覺得最後按效果付費會佔到很大的比例,雖然這個過程比較著急,但我覺得一定會進入這個階段,可能還需要3~5年的時間。

iCDO: 目前Sensors Analytics採集的數據主要是用戶行為數據,其他類型的數據也可以採集嗎?比如業務數據,線下數據等?

桑文鋒:都是可以採集的,比如客戶的業務數據,線下數據,服務端數據等,這些數據都能採集過來。從我們的理念上來說,大數據總結成四個字就是「大」、「全」、「細」、「時」,這裡面的「大」主要指宏觀的大,實際採集上我們並不用關注它;「時」指高實效,實時的數據,這個我們一般也忽略它,我們更多的是考慮一個「全」,一個「細」。其中「全」,就是指多種數據源,不管是客戶端的、服務端的、線上線下的、或是各種設備的,將數據全量採集。其次「細」,就是強調多維度,採集過來用戶一個提交按鈕,用戶一次瀏覽,他相關的維度「who、when、where,how、what」信息也採集起來,這才能建立一個好的數據底子,之後的分析也會變得容易很多了。

另一方面,這個數據不一定是來自於APP或是伺服器模塊,也有可能來自各種各樣的感測器、視頻、麥克風等等,未來是一個感測器時代,或者叫物聯網時代,不管是虛擬的還是物理的,這些數據我們都應該去做採集,這個階段一定會到來。

其實,這也是為什麼,神策數據的英文名字是「SensorsData」,就是感測器數據嘛。我們認為未來一定是感測器的世界,神策也在採集感測器數據方面做更多的工作。

iCDO: 會不會存在客戶不需要你去採集數據,他採集好的數據提供給你們,然後你們來為他們做預處理?

桑文鋒:我認為未來會有的,因為數據採集手段是多種多樣的,我覺得以後通上電的這種設備,各種各樣的感測設備都能採集到數據,比如就像我們看這個燈泡,其實它是在60赫茲以及相關條件等作用下在閃爍,這裡面也會涉及數據,以後也可以採集到,而如果客戶已經有了這些數據,交給我們的就是如何建好數據倉庫這一塊。即使到了一個新的階段,對於神策的定位來說,我們還是要幫我們的客戶把數據根基建好。

iCDO: 有一些企業比如說像Martech(Marketing Technology)這個領域,他們會直接把數據輸入到應用場景中去,用機器規則來實現一些業務上的操作、管理和應用,神策有準備做這個嗎?

桑文鋒:神策是處理數據流的,不會做流程與控制。但是神策是能夠給這些系統提供彈藥的,比如神策有用戶分群的分析功能,我們可以把滿足某些條件的用戶抽取出來,並提供到對應的營銷系統裡面去使用它。所以這些公司其實跟神策去結合起來,是可以事半功倍的。

iCDO: 的商業環境是這樣,大家更重視應用層面,會輕視後台的作用,您怎麼看這個問題?

桑文鋒:我相信其實美國也是一步步迭代出來的,我們現在看到美國互聯網環境很開放,介面很開放,大家都是組件式的,但我覺得在六七十年代美國剛使用這種大型機的時候,他們也是做全套系統的,但是後來競爭越來越激烈,就會要求你做好某一塊兒。這是我比較認同百度的一個理念,把事情做到極致,你可以少做一點,但是要把它做到最好。我覺得開放只是時間問題,可能就這3~5年的時間。到那個時候,後台的作用大家不僅不會輕視,反而一定會成為剛需。

iCDO: 預測下五年後的神策,您希望是什麼樣?

桑文鋒:五年後的神策,我希望完成了願景的70%。神策的願景是希望花十年的時間重構互聯網的數據根基,現在神策做了兩年了,服務300多家客戶,離目標還遠,但這個速度是指數級增長,是會越來越快的。

iCDO: 希望神策早日達到自己的目標。感謝文鋒

桑文鋒:謝謝!



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦