Zi 字媒體

機器人學習到底是怎樣的過程？

2021/12/25

賢集網物聯網工程頻道訊：從廣義上來說，機器學習是一種能夠賦予機器學習的能力以此讓它完成直接編程無法完成的功能的方法。但從實踐的意義上來說，機器學習是一種通過利用數據，訓練出模型，然後使用模型預測的一種方法。讓我們具體看一個例子。

拿國民話題的房子來說。現在我手裡有一棟房子需要售賣，我應該給它標上多大的價格？房子的面積是100平方米，價格是100萬，120萬，還是140萬？很顯然，我希望獲得房價與面積的某種規律。那麼我該如何獲得這個規律？用報紙上的房價平均數據么？還是參考別人面積相似的？無論哪種，似乎都並不是太靠譜。

我現在希望獲得一個合理的，並且能夠最大程度的反映面積與房價關係的規律。於是我調查了周邊與我房型類似的一些房子，獲得一組數據。這組數據中包含了大大小小房子的面積與價格，如果我能從這組數據中找出面積與價格的規律，那麼我就可以得出房子的價格。

對規律的尋找很簡單，擬合出一條直線，讓它「穿過」所有的點，並且與各個點的距離儘可能的小。

通過這條直線，我獲得了一個能夠最佳反映房價與面積規律的規律。這條直線同時也是一個下式所表明的函數：

房價 = 面積 * a + b

上述中的a、b都是直線的參數。獲得這些參數以後，我就可以計算出房子的價格。

假設a = 0.75,b = 50，則房價 = 100 * 0.75 + 50 = 125萬。這個結果與我前面所列的100萬，120萬，140萬都不一樣。由於這條直線綜合考慮了大部分的情況，因此從「統計」意義上來說，這是一個最合理的預測。

在求解過程中透露出了兩個信息：

1、房價模型是根據擬合的函數類型決定的。如果是直線，那麼擬合出的就是直線方程。如果是其他類型的線，例如拋物線，那麼擬合出的就是拋物線方程。機器學習有眾多演算法，一些強力演算法可以擬合出複雜的非線性模型，用來反映一些不是直線所能表達的情況。

2、如果我的數據越多，我的模型就越能夠考慮到越多的情況，由此對於新情況的預測效果可能就越好。這是機器學習界「數據為王」思想的一個體現。一般來說(不是絕對)，數據越多，最後機器學習生成的模型預測的效果越好。

通過我擬合直線的過程，我們可以對機器學習過程做一個完整的回顧。首先，我們需要在計算機中存儲歷史的數據。接著，我們將這些數據通過機器學習演算法進行處理，這個過程在機器學習中叫做「訓練」，處理的結果可以被我們用來對新的數據進行預測，這個結果一般稱之為「模型」。對新數據的預測過程在機器學習中叫做「預測」。「訓練」與「預測」是機器學習的兩個過程，「模型」則是過程的中間輸出結果，「訓練」產生「模型」，「模型」指導「預測」。

讓我們把機器學習的過程與人類對歷史經驗歸納的過程做個比對。

機器學習與人類思考的類比

人類在成長、生活過程中積累了很多的歷史與經驗。人類定期地對這些經驗進行「歸納」，獲得了生活的「規律」。當人類遇到未知的問題或者需要對未來進行「推測」的時候，人類使用這些「規律」，對未知問題與未來進行「推測」，從而指導自己的生活和工作。

機器學習中的「訓練」與「預測」過程可以對應到人類的「歸納」和「推測」過程。通過這樣的對應，我們可以發現，機器學習的思想並不複雜，僅僅是對人類在生活中學習成長的一個模擬。由於機器學習不是基於編程形成的結果，因此它的處理過程不是因果的邏輯，而是通過歸納思想得出的相關性結論。

這也可以聯想到人類為什麼要學習歷史，歷史實際上是人類過往經驗的總結。有句話說得很好，「歷史往往不一樣，但歷史總是驚人的相似」。通過學習歷史，我們從歷史中歸納出人生與國家的規律，從而指導我們的下一步工作，這是具有莫大價值的。當代一些人忽視了歷史的本來價值，而是把其作為一種宣揚功績的手段，這其實是對歷史真實價值的一種誤用。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點