search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

每周一本書之《Python大戰機器學習:數據科學家的第一個小目標》

數據猿導讀

要說時下最熱門的職業,既不是傳統的信息科學家,也不是大數據工程師,而是數據科學家!那麼,數據科學家必備的技能又有哪些呢?機器學習和Python一定是位列前五的兩項。

作者 | abby

數據科學家可謂是當下炙手可熱的職業,機器學習則是他們的必備技能。機器學習在大數據分析中居於核心地位,在互聯網、金融保險、製造業、零售業、醫療等產業領域發揮了越來越大的作用且日益受到關注。

Python作為最好最熱門的編程語言之一,以簡單易學、應用廣泛、類庫強大而著稱,是實現機器學習演算法的首選語言。

本周,小編就為大家分享一本有關機器學習和Python的入門級圖書《Python大戰機器學習:數據科學家的第一個小目標》。本書以快速上手、四分理論六分實踐為出發點,講述了機器學習的演算法和Python 編程實踐,採用「原理筆記精華 + 演算法Python 實現 + 問題實例 + 代碼實戰 + 運行調參」的形式展開,理論與實踐結合,演算法原理與編程實戰並重。

本書從內容上大致分為四個部分:

第一篇:機器學習基礎篇(第1~6 章):

包括線性模型、決策樹、貝葉斯分類、k近鄰法、數據降維、聚類和 EM演算法等內容。

這些基礎演算法非常經典,原理也相對簡單,是入門的最佳選擇,掌握這些演算法,才能更好地理解後續的高級演算法。非菜鳥可以直接忽略這部分。

第二篇:機器學習高級篇(第7~10 章):

包括支持向量機、人工神經網路、半監督學習和集成學習等內容。

這些高級演算法是目前應用非常廣泛,也是效果不錯的演算法,需要深入理解演算法的原理、優劣勢等特點以及應用場景,要能達到應用自如的程度。

第三篇:機器學習工程篇(第11~12章):

講述機器學習工程中的實際技術,包括數據預處理,模型評估、選擇與驗證等內容。

數據清洗、數據預處理和模型評估選擇在實際中非常重要,在整個工程項目的開發過程中通常佔到一半以上的時間,這部分給出的一些步驟和方法是實踐的精華,值得熟練掌握。

第四篇:Kaggle 實戰篇(第13章):

Step by step講述了一個Kaggle競賽題目的實戰,有代碼,有分析。

Kaggle是目前頂級的數據科學比賽平台,很多機器學習的牛人都在這裡玩過,咱們可以學習牛人好的演算法,也可以啟發自己的思路。對於夢想成為牛人的您,還是去裡面混混先:)萬一拿了個好的名次呢,拿個一流公司的offer還是很easy的。

適讀人群:

本書可供為高等院校計算機、金融、信息、自動化及相關理工科專業的大學部生或研究所使用,也可供對機器學習感興趣的研究人員和工程技術人員閱讀參考。

本書的代碼全部開源,請自行下載 https://github.com/huaxz1986/git_book,也歡迎在這上面交流。

《雲端:動蕩世界中的大數據》:大數據並非無所不能,該批判的時候請不要手軟!



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦