search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

大數據框架到底是什麼?

有人可能對大數據不是很了解,下面小編給大家簡單的介紹下:

它是收集整理和處理大容量數據集,並能夠從中獲得見解非傳統戰略和技術的總稱。雖然處理數據需要計算的能力早已超過一台計算機的上限,但是這種計算類型的普遍性、規模價值在最近幾年才進行了大規模擴展。

小編這篇文章將介紹大數據里最基本的一個組件:處理框架。其實就是負責對系統中的數據進行計算,比如處理從非易失存儲中讀取的數據,又或者說處理段時間攝入到系統中的數據。

大數據處理框架是什麼?

不算是處理框架還是處理引擎都要負責對數據系統中的數據進行計算。雖然引擎和框架之間沒有什麼定義,但是大部分的時候可以將引擎實際負責成處理數據操作的組件,定義為承擔類似作用的組件。

給大家介紹個例子,這樣也方便大家理解:

比如Apache Hadoop可以看成一種以MapReduce作為默認處理引擎框架。引擎和框架通常是可以相互替使用的。比如另一個框架Apache Spark可以納入Hadoop並取代MapReduce。組件之間的這種靈活的互操作性是大數據特點之一。

雖然負責處理生命周期內這一階段性的數據系統都很複雜,但從大的層面來看目標是非常一致:通過對數據執行操作能夠提高理解能力,並且也揭示出數據蘊含的模式,針對複雜互動獲得最終見解。

為了簡化這些組件的討論,我們會通過不同處理框架的設計模式和意圖,按照所處理的數據狀態對其進行歸類。一些系統可以用批處理方式處理數據,也可以用一些系統用流方式處理連續不斷流入系統的數據。此外還有一些系統可以同時處理這兩類數據。

大家先對大數據有個概念吧,這玩意其實還是看視頻畢竟理解的快,看文章的理解的話太難了。

也歡迎大家看我的七招輕鬆愉快的學習java那篇文章

大數據馬士兵2017hodoop2.7最新視頻:



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦