Zi 字媒體

如何區分人工智慧、機器學習和深度學習？

2021/12/25

本文內容來自於矽谷投資人Lake Dai，LDV Partners合伙人。嚴肅編輯整理。

人工智慧(Artificial Intelligence)是一個最廣泛的概念，人工智慧的目的就是讓計算機這台機器能夠象人一樣思考，而機器學習(Machine Learning)是人工智慧的分支，專門研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，使之不斷改善自身的性能。

深度學習(Deep Learning)是一種機器學習的方法，它試圖使用包含複雜結構或由多重非線性變換構成的多個處理層（神經網路）對數據進行高層抽象的演算法。

神經網路是一組大致模仿人類大腦構造設計的演算法，用於識別模式。神經網路通過機器感知系統解釋感測器數據，能夠對原始輸入進行標記或聚類等操作。神經網路所能識別的模式是數值形式，因此圖像、聲音、文本、時間序列等一切現實世界的數據必須轉換為數值。

在深度學習網路中，每一個節點層在前一層輸出的基礎上學習識別一組特定的特徵。隨著神經網路深度增加，節點所能識別的特徵也就越來越複雜，因為每一層會整合併重組前一層的特徵。

（http://fortune.com/ai-artificial-intelligence-deep-machine-learning/）

上圖顯示了一個神經網路用於判定一個圖片是不是一條狗的過程，輸入是圖片，通過深層神經網路對狗的低層特徵進行抽象，最後輸出是圖片是狗的概率。

深度學習的過程同樣是分為訓練和推理（既「評估」）兩個過程，通過訓練過程來獲得數據模型，然後用於評估新的數據。

數據模型分為兩種，一種是所謂判別模型(Discriminative Model)，也就是說模型可以直接用來判別事物的。這裡所說的判別事物，最典型的就是做分類。既然直接可以用來分類，也就是說我們可以在已知屬性的條件下，對該記錄進行判斷。所以，判別模型是對條件概率進行的建模，也就是p(Y|X)。這裡X就是屬性集合，實際上就是一個向量；而Y則可能是一個值（此時對應分類問題），可能是一個向量（此時對應序列標註問題）。判別模型常用於處理分類問題（比如鑒定垃圾郵件）、圖像識別等等。

再說一說生成模型(Generative Model)。生成模型可以描述數據的生成過程。換句話說，已知了這個模型，我們就可以產生該模型描述的數據。而數據由兩部分組成，也就是(X,Y)，前者是特徵，後者則是類別(Y是標量)或者序列類別(Y是向量)。要描述整個數據，也就是要對p(X,Y)進行建模，所以是對聯合概率進行建模。生成模型本身不是做分類或者序列標註的，但是可以用來解決這些問題，也可以用於生成式問題，比如聊天機器人、比如AI譜曲等問題。

而機器學習可以分成下面幾種類別：

監督學習從給定的訓練數據集中學習出一個函數，當新的數據到來時，可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出，也可以說是特徵和目標。訓練數據中的目標是由人標註的。常見的監督學習演算法包括回歸分析和統計分類。
無監督學習與監督學習相比，訓練集沒有人為標註的結果。常見的無監督學習演算法有聚類。
半監督學習介於監督學習與無監督學習之間。它主要考慮如何利用少量的標註樣本和大量的未標註樣本進行訓練和分類的問題。。
增強學習通過觀察來學習做成如何的動作。每個動作都會對環境有所影響，學習對象根據觀察到的周圍環境的反饋來做出判斷。

在傳統的機器學習領域，監督學習最大的問題是訓練數據標註成本比較高，而無監督學習應用範圍有限。利用少量的訓練樣本和大量無標註數據的半監督學習一直是機器學習的研究重點。

當前非常流行的深度學習GAN模型和半監督學習的思路有相通之處，GAN是「生成對抗網路」（Generative Adversarial Networks）的簡稱，包括了一個生成模型G和一個判別模型D，GAN的目標函數是關於D與G的一個零和遊戲，也是一個最小-最大化問題。

GAN實際上就是生成模型和判別模型之間的一個模仿遊戲。生成模型的目的，就是要盡量去模仿、建模和學習真實數據的分佈規律；而判別模型則是要判別自己所得到的一個輸入數據，究竟是來自於真實的數據分佈還是來自於一個生成模型。通過這兩個內部模型之間不斷的競爭，從而提高兩個模型的生成能力和判別能力。