search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

阿里發布的機器學習平台PAI2.0,和騰訊的DX-I區別在哪? | 雲棲2017深圳

今天,雲棲大會·深圳峰會在深圳如期舉行,這是今年雲棲大會的第一站,雖然規模不及阿里主場杭州的雲棲小鎮,但按照慣例,每屆雲棲大會阿里都會發布一系列重磅產品,這次也不例外。

本屆雲棲大會的主題是「飛天 · 智能」,和去年10月杭州站的「飛天·進化」相比看似沒有太大的變化,但很明顯的是,無論是主題演講還是會場展區,人工智慧已經取代雲計算成為了出現頻率最高的詞,而其最新發布的機器學習平台PAI2.0當之無愧成為了大會的焦點。

有趣的是,在大會前一天,騰訊剛剛發布了DX-I深度學習平台,根據騰訊官方的介紹,DX-I將基於騰訊雲的大數據存儲與處理能力來提供一站式的機器學習和深度學習服務,隨著阿里機器學習平台PAI2.0的發布,兩大平台孰優孰劣便引起了一陣熱議。當然,兩款產品都是剛發布不久,要下結論,還需要等待第三方應用的檢驗。

但本著求知探索的精神,雷鋒網()還是找出了PAI2.0與DX-I之間一些微妙的差異。

定位

毋庸置疑,DX-I和PAI2.0分別是騰訊和阿里人工智慧戰略的重要組成部分,PAI2.0還是阿里NASA計劃發布后的首款重磅產品。但從字面上就可以看出,二者定位還是有一定的差異。

雷鋒網從騰訊內部人士得知的信息是,DX-I更注重深度學習,而PAI2.0則是包含深度學習在內的機器學習,因此PAI2.0的輻射範圍會更大,換言之,如果你如果使用的不是深度學習演算法和模型,那麼DX-I就失效了,但你可以選擇PAI2.0。

當然,換個角度看,在深度學習火爆的今天,DX-I可能會保持更高的專註度。

深度學習框架

的支持

根據阿里官方的信息,PAI2.0可以支持Tensorflow、Caffe以及MXNet,用戶可以通過拖拉拽的方式可視化的操作組件來進行試驗。

DX-I也支持三大深度學習框架,不過這三個框架是TensorFlow、Caffe以及Torch,除了這一點區別之外,它也支持可視化的拖拽布局,即拖即用。

不過,PAI2.0還提供了邏輯回歸、隨機森林、GBDT、KMeans等常規的機器挖掘演算法,以及文本分析和圖演算法。

底層計算資源的支持

對於底層計算資源,PAI2.0提供了雲端異構計算資源,包含CPU、GPU、FPGA。在GPU方面,PAI2.0可以靈活實現多卡調度。

DX-I主要基於騰訊雲的GPU計算平台,和異構計算相比還是略顯單薄。

不過,對於深度學習而言用GPU來計算也有一定的優勢,綠米聯創首席演算法工程師曲曉峰告訴雷鋒網,「深度學習可以輕易的通過GPU提升準確率和并行加速,其它方法都還沒有這樣的效率。」他繼續指出,很多其它演算法也可以不斷迭代優化,但沒法達到深度學習這樣地高效充分利用GPU的并行性。

曲曉峰表示,「異構計算的優勢在於絕對運算量要求高的那些傳統應用,例如氣象、核爆模擬、渲染等。其劣勢是,異構計算為了可以調用不同的底層對於演算法的要求較高,現在缺乏殺手級的領軍演算法。」

內部測試以及應用情況

據雷鋒網了解,從PAI1.0開始,該機器學習平台已經在阿里巴巴內部使用了2年。基於該平台,在淘寶搜索中,搜索結果會基於商品和用戶的特徵進行排序。通過使用參數伺服器,淘寶可以把百億個特徵的模型,分散到數十個乃至於上百個參數伺服器上,打破了規模的瓶頸。

而DI-X在騰訊內部使用了一年,其主要用於遊戲流失率預測、用戶標籤傳播以及廣告點擊行為預測等。以用戶行為預測為例,藉助DI-X平台,可以方便的拖拽出一個BRNN Encoder模型(雙向循環神經網路編碼器),從用戶自身和用戶圈子好友的行為序列數據中提取出基礎特徵,進行棧式自編碼(Stacked Auto-Encoder)模型的訓練,充分利用RNN的模型特點,得到比常規模型更精準的行為預測效果。

不難發現,PAI和DI-X都是經內部測試成熟后才對外開放出來的,只不過相較而言,PAI是一個更加成熟的產品,其已經在廣東省氣象局和華大基因等機構實現了應用。

因此,從多個維度比較的結果來看,兩個平台很難一分高下,主要還得看應用場景,如同Tensorflow、Caffe和MXNet這三大主流的深度學習開源框架:Tensorflow的優勢是開源演算法和模型最豐富;Caffe則是經典的圖形領域框架,使用簡單;MXNet在分散式性能上表現優異。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦