search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

四月讀書:10本免費機器學習與數據科學電子書

一年之計在於春。春天都不看書的話,你還指望自己哪個季節看?四月不翻書,五月就參與不了同行討論,六月就看不懂行業新聞,七月老闆就該讓你去財務結賬走人了。論大數據人的自我修養:手不釋卷。

給你準備了10本免費機器學習和數據科學電子書,就問你,看不看?!

本書單根據內容深度排序,從基礎統計學到基礎機器學習,再到內容更深入的專著,從具體的話題討論,到整個行業的分析。這些書中既有數據科學經典讀本,也有最近出版的新書,希望你能從中找到感興趣的閱讀材料。

1.《統計思維:程序員的概率與統計學》

ThinkStats: Probability and Statistics for Programmers

作者:Allen B. Downey

《統計思維》是針對Python程序員編寫的概率和統計學專著。

《統計思維》一書強調利用簡單的技術處理實際數據集(real dataset)、回答一些有趣的問題。書中還介紹了對美國國立衛生研究院的案例分析。作者鼓勵讀者在實際數據集項目中通過實踐來學習。

2. 《黑客的概率編程與貝葉斯方法》

Probabilistic Programming & BayesianMethods for Hackers

作者:Cam Davidson-Pilon

從計算理解第一、數學第二的角度介紹了貝葉斯方法和概率編程。

貝葉斯方法是推理的自然方法,本書用很多章節詳細解釋了數學分析過程。一般介紹貝葉斯推理的文本都會用2到3章介紹概率論,然後再介紹什麼是貝葉斯推理。

但是由於貝葉斯模型涉及到的數學內容對一般讀者來說太困難,所以很多書在介紹貝葉斯模型的時候只會用到簡單的、理想化的案例。這其實是讓讀者對貝葉斯模型理解的誤導。

事實上,這本書就是作者避免了上述情形來寫的。

3. 《深入理解機器學習:從原理到演算法》

Understanding Machine Learning: From Theoryto Algorithms

By Shai Shalev-Shwartz and Shai Ben-David

本書為劍橋大學機器學習教材。機器學習是計算機科學領域發展最快的分支之一,其應用具有深遠的意義。

本教科書的目的是有條理地介紹機器學習及為讀者提供演算法範例。本書介紹了機器學習基礎知識,並詳細解釋了將這些原理轉化為實際演算法的數學推導理論論述。

除了介紹基礎知識之外,本書還涵蓋了以前教科書無法解決的一系列中心課題,包括討論學習的計算複雜性,分析了凸度和穩定性的概念,書中介紹的重要的演算法範例包括隨機梯度下降,神經網路和結構輸出學習,同時還介紹了諸如PAC-Bayes方法和基於壓縮的邊界等新興理論概念。

4. 《統計學習基礎:數據挖掘、統計與預測》

The Elements of Statistical Learning

作者:Trevor Hastie, Robert Tibshirani and Jerome Friedman

這本書在普遍概念框架中描述了數據學領域的重要思想。雖然這種方法屬於統計學範疇,但本書的重點在於概念而不是數學。

書中列舉了許多例子,並大膽的採用色彩豐富的圖片。對所有數據科學或行業數據挖掘感興趣的人來說,這本書都是不可不讀的寶貴的資源。

這本書的內容涵蓋範圍廣泛,從監督式學習(預測)到無監督式學習。討論的話題包括神經網路,支持向量機,分類樹,其對boosting演算法的討論更是首創。

5. 《統計學習導論:基於R應用》

An Introduction to Statistical Learningwith Applications in R

作者:Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani

本書為數據學習方法的導論,面向非數學專業的高年級大學部生、碩士和博士研究所。本書還涵蓋了大量的R實驗,詳細解釋了在實際生活中如何踐行不同的方法,因此對於實踐派數據科學家來說是有用的資源。

6. 《數據學基礎》

Foundations of Data Science

作者:Avrim Blum, John Hopcroft, and Ravindran Kannan

雖然計算機科學的傳統領域仍然非常重要,但越來越多的研究人員將使用計算機來了解和提取應用程序中出現的大量數據的可用信息,而不僅僅是利用計算機解決特定的問題。

考慮到這一點,本書在寫作中涵蓋未來40年中可能會有所應用的理論,正如過去40年裡,自動控制原理,演算法和相關主題發揮的巨大作用一樣。

7. 《寫給程序員的數據挖掘實踐指南》

A Programmer』s Guide to Data Mining: TheAncient Art of the Numerati

作者:Ron Zacharski

本指南遵循循序漸進、逐步學習的原則引導讀者閱讀。在閱讀本書時,作者建議讀者通過提供的Python代碼來練習和實驗。

希望讀者能積极參与數據挖掘技術的試用和編程。這本書可以說是給讀者提供了手把手輔導,閱讀完此書會給讀者日後更深入了解數據挖掘技術打下堅實基礎。

8. 《大數據:互聯網大規模數據挖掘與分散式處理》

Mining of Massive Datasets

作者:Jure Leskovec, Anand Rajaraman and Jeff Ullman

本書的編寫基於斯坦福大學計算機科學課程「CS246: Mining Massive Datasets」。

這本書和斯坦福的課程一樣,是為沒有計算機基礎的大學部學生設計的。為了支持讀者進行更深入的探索,大部分章節最後都補充了深度閱讀參考資料。

9. 《深度學習》

Deep Learning

作者:Ian Goodfellow, Yoshua Bengio and Aaron Courville

《深度學習》這本書旨在幫助學生和從業人員了解機器學習領域,特別是深度學習。

10. 《嚮往的機器學習》

Machine Learning Yearning

作者:吳恩達

人工智慧,機器學習和深度學習掀起了眾多行業的改革浪潮。但建立機器學習系統之前,你必須做出以下幾個具有實際意義的決定:

你還要收集更多的訓練數據嗎?

你應該採用端對端的深度學習嗎?

你打算如何應對訓練數據與測試數據機組不匹配的情況?

等等……

以前,要想知道怎麼回答這些問題、怎麼做出明智決策,你只能回學校去讀研究所課程,或者進公司給前輩當學徒。為了改變這種情況,作者寫作了此書,幫助讀者更好的構建人工智慧系統。

註:推薦圖書的全部清單,請在燈塔大數據公眾號里回復「四月計劃 」即可下載!

AD:【Hi】大數據的老朋友,加入最活躍、最溫暖的大數據QQ群!!

註:數據分析網遵循行業規範,任何轉載的稿件都會明確標註作者和來源,若標註有誤或遺漏,請聯繫主編郵箱:[email protected]



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦