search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

明略數據副總裁黃代恆:感知與洞察-工業大數據應用實踐

CNII網訊 3月28日,在工業和信息化部的指導下,為期兩天的「2017大數據產業峰會」在北京國際會議中心召開。本次會議由信息通信研究院和通信標準化協會共同主辦,數據中心聯盟大數據發展促進委員會承辦,旨在宣貫和解讀《大數據產業發展規劃(2016-2020年)》,支撐大數據國家戰略落地,展示大數據產業發展成果,探討發展面臨重大問題,推動產業交流與合作。

明略數據副總裁 黃代恆

本文內容整理自信息產業網

明略數據技術副總裁黃代恆在29日下午的工業大數據論壇上發表了題為《感知與洞察-工業大數據應用實踐》的演講。

以下為內容實錄

尊敬的各位來賓大家下午好!我是明略技術中心的副總裁。今天各位領導講到很多的應用,今天想跟大家深入探討的兩個方面應用,一個是感知,一個是洞察。什麼是感知?感知是利用分散式存儲、計算計算將海量的感測器收集到的數據實時匯總,實現狀態監控、感知隱患、避免風險。在感知過程中隱含了預測。

感知畢竟是已經對客觀事件持續發生事情的已知,洞察不一樣,已知的事件只能觀察到A、B、C、D等15個維度,這15個維度後面可能的原因是什麼?

在整個過程中,大數據在故障分析方面,能夠在高速和自動實現更大價值。

這個事一直在提,關於大數據能不能在工業領域上用,用在哪些行業上,為什麼是這些行業?一來就發現很多能源很多高端製造,很多軌交領域,為什麼是他們?這並不是偶然的。我們的能源、高端製造、冶金、建設本身是國家的核心棟樑,它的感測層、傳輸層漸漸具備起來,如果把物聯網整個看實際上是三層,最低端是感測層。

下面我從感知和洞察兩個方向介紹一兩個非常實際的例子。首先來講怎麼感受到,其實就在此時此刻有數千輛列車賓士在大國高速鐵路上,每個感測器是數以萬計的。在大數據環境下,支持多源異構和協議解析是一個核心技術問題,特別是海量設備實時產生和回傳的感測器二進位數據。解決方案的幾個核心要素是:高併發、可配置、保證時序、支持多態應用。

再舉一個例子,這也是在很多交通領域、能源領域遇到的典型問題。某個典型的牽引動力、軌道、交通領域場景,車載設備發生了故障,其實前後若干秒是有一個高頻數據的。不管是強電牽引動力,還是汽車發動機還是變速箱、車輪的數據都是由頂層專家進行分析的。大家可以想象整個的周轉系統一來慢,時效性不高,二來零散。專家也是人,原來專家標註這個樣本時一天效率低的6-80個,最快的有200個。現在的技術演變到今天,可以幫助大家解決這個問題。

全國載運的大部分情況沒有問題,只有一個點標成了紅色,不是意味著整個車有問題,只是其中某個小環節有異常。真正做的是系統能夠自動根據一些規則,發現問題。比如捷運遇到故障,大數據平台實時檢測到,或者比如歷史上出現這種事,立刻調記錄,上次的檢驗結果對這輛車這個地方的檢驗結果有一處沒有查,就立刻發過來。我們以設備為主體實現信息的聚合,很多信息聚合進來,比如說車輛運行的設備,比如說軌旁檢測設備,包括點巡檢設備都聚合在當中,通過這種聚合來實現。

剛才也有各位展示過很好的報表和銷售狀況,這些都是發生客觀現實的直觀展示。更多是這個事情為什麼發生?可能的原因是什麼?如何實現洞察,事實來講有三個手段:

一、基於專家規則;

二、基於特徵分析;

三、基於深度學習。

比如說什麼叫專家規則,舉一個中醫的例子,老中醫說的你這個人看你這個特色是體寒,他是根據一些身體特徵判斷出了一些癥狀,從而得出一些結論。這些結論其實背後是可以數據化的,如果把相關的數據量化,用數據關聯表現出來,通過它的斜率和導數完全可以把專家判斷邏輯轉成機械,這是專家規則的機械化。

剛才我們在講到異常的時候,其實這些異常有很多是跟數據有關係的。可能主要維度80-100個,但其中選出15個特徵來,我們通過不斷的做嘗試,如果這條線比較平緩,說明某一個維度的特徵和異常沒有直接的關係。如果這個斜率非常抖,說明兩者關係比較大。這個描述簡單,因為數據量比較大,我們需要採取多個特徵,把很多的特徵放到一個平面上來進行降維分析,去發現問題。

包括剛才說的簡單回歸,還有一類是分類問題。用分類解決數據問題,有很多的方法,通常在實際應用中,我們利用多種方法組合使用。

最後一條路,這種模式的識別,是通過不斷的小模式一層一層組合成大模式。也許這個東西預測量非常之大,取出來的數據可能不是這麼多,但是當中有無數的迭代,一台GPS基本可以達到八台以上的普通計算機運算能力。比如說一個一台常態0.95%,比別的概率高了很多。

跟大家說感知和洞察是工業互聯網特別是感測器互聯網過程中非常重要的,到現在為止它還有很多的問題,比如說在感知中要實現高併發、無遺留、靈活配置,保證時序,還要實現整個系統多個系統匯聚起來,不同標本能夠匯聚起來實現不同的場景。

洞察方面,手段結合、適宜為佳。數據科學家在現場,每個行業面臨的情況不一樣一定要有科學家在現場。最後一個是樣本積累,循環迭代。這種樣本積累要早做到,包括人臉識別最近的爆發,也是跟樣本積累有很大的關係。

說了很多,首先第一條主線是感測器設備主線,生產系統、ERP、MES這兩個數據最後可以做匯總分析。這個是非常完整的大數據,我們已經跟軌交某些部門合作,把所有的技術積累,在這個領域最佳的實踐跟我們的客戶一起在這個行業做一些貢獻。

最後我想跟大家說一下,這也是在做大數據應用中比較重要的,有三種東西一個是數據,一個是技術,一個是業務。很多公司說數據最重要,沒有數據什麼都不重要。但是從我自己的經驗來看,我覺得業務價值最重要。最終你數據做的有沒有價值,要落到業務裡面。沒有業務場景,整個的調性非常低。

在大數據基礎上,現在有自己很多的項目,我們也有了國際大型公司一樣的接入能力、轉換能力和數據處理能力,我也希望和大數據產業中踏踏實實在做時間的公司一起,隨著優秀的製造企業的發展,隨著傳統企業的轉型升級,明略數據希望與這次浪潮中,助力傳統產業用更智能、更高效的科技手段成就為發展的中堅力量。

相關閱讀



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦