search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

國外專家支招:實施大數據分析項目,企業如何避免失敗?

毫無疑問,大數據分析為企業提供了新的洞察力,可以幫助其更好的應對競爭對手,同時,也為企業帶來了新的收入增長點。然而,如果數據分析項目失敗了,也可能會給企業帶來巨大損失,特別是大量資金和時間的浪費。

如何避免數據分析項目失敗?從企業管理角度出發,有一些基礎準備工作是必須的:首先,一定是由公司的管理層推進併購買相關服務或工具,以確保能夠獲得足夠的技術和資金支持;另外,企業需要對員工進行專業技能培訓。如果這兩項基礎工作沒有做好,那麼其他一切都無從談起。

假設這些基礎工作已經完成,而您正打算選擇一款數據分析工具部署到業務系統中,這時,需要注意哪些問題呢?以下是 Computerworld 特約撰稿人 Bob Violino 給您的六條忠告,希望對準備使用大數據分析產品的小夥伴有所幫助。

謹慎選擇數據分析工具

任何供應商都會將「大數據」或「高級分析」一詞放在他們的產品介紹中,試圖利用這些術語進行炒作。但往往很多產品在功能和效率上有著很大的不同。即便選擇一款功能強大的產品,它也未必能夠滿足你的需求。

幾乎所有的大數據產品都會有一些基本特性,比如數據轉換和存儲架構(想想 Hadoop 和 Apache Spark),但在數據分析方面,還是有很多不同,比如在數據挖掘、預測分析、實時分析、人工智慧以及智能儀錶盤等方面。

在決定購買任何大數據分析產品或存儲平台之前,你需要真正了解公司的業務體系和需求,以便選擇能夠有效解決問題的產品。

比如,如果有處理大量的複雜數據(文本、音頻、視頻等)的需求,那麼你需要選擇一款能夠分析非結構化數據的產品;反之,你只需要一款性價比較高的產品就足夠了(大部分數據分析產品都支持結構化、標準化數據)。此外,在進行產品選型時,至少需要對比兩種產品,還要注意該產品是否可以與企業內部的系統進行對接。

每款大數據分析產品都會在系統中建立數據模型,這也是項目實施過程中最重要的環節,而此環節必須確保是由供應商和企業業務負責人共同完成,儘管這會浪費一些時間,但絕對沒錯。

另外需要注意的是,優秀的產品會將數據分析結果呈現並翻譯成「商業語言」,業務人員可以完全看明白,從而根據這些信息改進業務流程或尋找新的商業機會。

確保分析工具簡單易用

大數據分析是一項非常複雜的技術,但是對於企業業務人來說,根本無需知道產品是如何訪問並分析數據的。企業所需要的就是一款簡單高效、用於數據採集、分析以及可視化的工具。

「找到合適的數據分析工具確實很困難」,域名註冊商 GoDaddy 負責 BI 分析的 Sharon Graves 表示,「它必須簡單並可以快速可視化,而且還能夠進行深度分析。」

此外,更重要的是,一定不要向非技術人員(業務人員)提供「程序員」級別的工具,他們會瘋的!

項目、數據與實際業務需要相結合

正如之前所提到的,數據建模環節需要由軟體供應商與企業業務負責人共同完成。Experian 首席科學家、高級副總裁 Shanji Xiong 博士也認為,「導致數據分析項目失敗的一個重要原因就是,企業最終並沒有解決業務中所存在的真實問題。關鍵在於,在項目早期一定讓具有專業背景的數據科學家參與進來。」

據 Shanji Xiong 博士介紹,之前 Experian 公司在做數據分析項目時就碰到了一個這樣的例子。「當時,我們需要一套數據分析解決方案來打擊身份欺詐,其中存在兩個技術挑戰:第一是分析客戶姓名、地址和 PII(社會保障號)等這些個人信息;第二是分析客戶申請貸款的相關信息。」最初 Experian 認為這兩種情況可以被看過同一個問題去解決,但實際上,它們需要創建不同的數據分析模型。

建立數據湖泊,千萬不要「吝惜」帶寬

過去,很少有企業可以存儲如此多的數據,更不要提進行有效的組織和分析了。而在今天,不管是在雲端還是本地,高性能存儲和大規模并行處理技術已經被廣泛應用。

但是,光靠存儲還遠遠不夠,你需要能夠處理不同類型的數據,從而再進行大數據分析。這也就是 Hadoop 的最大優勢,它支持存儲和處理巨大的不同類型的數據集,這些數據集我們稱之為「數據湖泊」。真實的湖泊會包含許多種動植物,而數據湖泊則包括眾多數據源,以及不同類型的數據。

「數據湖泊絕不是堆積數據的場所,你需要考慮如何以有價值的方式聚合數據、擴展其屬性。創建數據湖泊,並進行採集、索引、標準化,是大數據分析策略中非常重要的一環。」亞利桑那州立大學計算研究主任 Jay Etchings 說。

「同樣,擁有足夠的帶寬也至關重要。否則,會嚴重影響數據湖泊從數據源提取數據的速度,以及業務人員進行數據分析的流暢度。」 Jay Etchings 認為,「從社交媒體趨勢到交通狀況,都非常依賴實時分析,而這就要求你的數據湖泊要有足夠的帶寬。」

每一個環節都要考慮安全性

大數據分析讓企業擁有了從數據中獲取有價值信息的能力,「但有一個問題是,系統管理和安全會變得更加複雜」,Jay Etchings說。在大數據分析系統等關鍵任務上,如果未採取足夠的防護措施,那麼無疑會產生大規模問題。

眾所周知,企業採集、存儲、分析和共享的大部分數據都是客戶信息——其中一些信息更涉及到個人隱私,如果這些數據落入他人之手,結果將是:企業可能會面臨法律訴訟和監管部門罰款、品牌和聲譽受損以及客戶的不滿。

對於準備部署大數據分析的企業來說,安全措施不僅要包含一些基本的工具,例如實時數據加密、身份和訪問管理、網路安全等,還應包括對員工進行如何正確訪問和使用數據的相關培訓。

數據管理和質量是「頭等大事」

良好的數據管理和質量控制,已成為所有大數據分析項目成敗的關鍵因素。企業需要確保數據的及時更新,準確並實時進行傳送。

在 GoDaddy 公司的大數據分析項目中,如果數據更新延遲或失敗,系統都會自動報警並通知給系統管理員。此外,系統也會對針對一些關鍵指標進行數據質量檢查,如果出現不符合預期的指標,系統也會發送警報。

為確保數據管理和質量控制,企業最好雇傭專業的數據管理人員(數據管理總監)或由管理層人員進行監督。

註:本文由 DataHunter 編譯自 Computerworld《How to avoid big data analytics failures》,作者 Bob Violino。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦