search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

大數據實驗室:零基礎學習大數據該看哪些書?

小編身邊有很多朋友對大數據行業心嚮往之,卻苦於不知道該如何下手。作為一個零基礎大數據入門學習者該看哪些書?今天給大家推薦一位知乎網友挖礦老司機的指導貼,作為參考。

就目前公司招聘和其他所了解到的大數據專業的工作內容,偏重方向和技術選型有所不同。作者就不同職業學習的書籍進行了分類推薦。

1.大數據工程師

在互聯網公司廣泛招聘,偏平台業務方向,ETL和OLTP等,主要是基於Hadoop技術棧來處理大數據,演算法要求不是特別高。

經典圖書推薦:《Hadoop權威指南》《Hive編程指南》《Hbase權威指南》《大數據技術全解》、《大數據挑戰NoSql》《Mahout實戰》

2. 數據分析師:

在擁有行業數據的電商、金融、電信、諮詢等行業里做業務諮詢,商務智能,出分析報告,互聯網公司的產品經理差不多類型了,統計學能力要求高,SPSS、SAS、R、SQL。

經典圖書推薦:《概率論與數理統計》、《統計學》推薦David Freedman版、《業務建模與數據挖掘》、《數據挖掘導論》、《SAS編程與數據挖掘商業案例》、《Clementine數據挖掘方法及應用 》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。

3. 數據挖掘工程師:

在互聯網、電商、搜索、社交等大數據相關行業里做機器學習演算法實現和分析,基本數據結構演算法、機器學習等都要求較高。Hadoop、spark技術棧,Java、Python、C++、Scala、Shell。

經典圖書推薦:《數據挖掘概念與技術》、《數據挖掘導論》、《數據挖掘-實用機器學習技術》;《機器學習》Tom Michael 、《機器學習導論》、周志華《機器學習》、《機器學習實戰》、《集體智慧編程》、《統計學習方法》ESL 《Elements of Statistical Learning》 ISL 《An Introduction to Statistical Learning》PRML 《Pattern Recognition and Machine Learning》《資料庫系統概論》、《演算法導論》、《Web數據挖掘》、《推薦系統》、《數據可視化》《Thinking in Java》、《Python核心編程》、《Thinking in C++》等。

4. 科學研究方向:

在高校、科研單位、企業研究院等高大上科研機構研究新演算法效率改進及未來應用,還有現在很多計算機視覺的創業公司的演算法研究。

經典圖書推薦:《機器學習》《模式分類》《統計學習理論的本質》《統計學習方法》《數據挖掘實用機器學習技術》《R語言實踐》,《人工智慧及其應用》、《概率圖模型》英文素質是科研人才必備的《Machine Learning: A Probabilistic Perspective》《Scaling up Machine Learning : Parallel and Distributed Approaches》《Data Mining Using SAS Enterprise Miner : A Case Study Approach》《Python for Data Analysis》等。

當然還有一步很重要就是不斷練習、練習、練習,將學到的知識與實際應用場景相結合,學會寫代碼也很重要哦。大數據學科是一門綜合學科,對於教授該專業的老師也是一項很大的挑戰。

日前,中科天璣大數據實驗室平台已經上線,該平台內置了大數據專業課程、大數據實戰案例和雲計算OpenStack三大類課程。設置了大數據技術基礎、大數據離線計算、大數據實時計算、大數據高級進階等不同深度的課程,滿足不同學習程度學生的訴求。課程視頻由業內大數據專家和高校大數據專業授課老師錄製,並配合有大數據行業經典實戰案例,真正讓老師能夠輕鬆授課,讓學生能夠快速掌握知識。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦