Zi 字媒體

4個學生，1個暑假，百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

2021/12/25

作為商業公司的百度正在積極推動開源文化。百度 COO 陸奇曾在內部講話中表示，開源代碼寫得好，不僅能解決大家的痛點，開源的代碼也會變得越來越強，開源代碼的生命力也必然會超過封閉體系的代碼。而百度的深度學習平台 PaddlePaddle 開源后，來自北京工業大學的 4 位學生利用其深度學習模型，製造了一台智能桃子分揀機。

2017 年夏天，果農劉連全的大桃有了別樣的用途，為智能桃子分揀機提供了 6400 張照片。

北京工業大學的 4 位學生利用百度 PaddlePaddle 開源平台上的深度學習模型，用這些大桃照片，通過機器學習和模型訓練，製造了一台智能桃子分揀機，從形狀、大小、色澤、光潔度等多維度，對桃子自動分級，從而實現自動分揀。

機器分揀大桃

桃農使用機器

深度學習與果蔬分揀融合，減輕農民的負擔

CB Insights 的數據表明，過去 5 年，農業科技初創企業募集了超過 8 億美元的資金。自 2014 年起，融資交易開始猛增，與醫療、金融等領域相比，毫不遜色。

據世界銀行的數據顯示，到 2050 年，世界食物產量至少需要提高 50%，這樣才足以養活屆時可能達到 90 億的龐大人口。但逐漸變暖的氣候變化可能致使農作物產量減超過 25%。

人工智慧則有望解決這一問題。

據《連線》雜誌報道，生物學家戴維·休斯（David Hughes）和作物流行病學家馬塞爾·薩拉斯（Marcel Salathé）使用深度學習，通過對 5 萬多張植物葉照片的訓練，可以檢測出 14 種作物的 26 種疾病，準確率高達 99.35%。

農業機器人公司 Blue River Technology 開發的智能化機器人通過攜帶的照相設備每分鐘掃描 5000 株幼苗，利用機器學習以及計算機視覺技術識別作物幼苗和雜草。如果是雜草或者長勢不好的作物，就使用農藥噴霧，如果幼苗間距過小，就會自動拔掉一棵。

Prospera 公司則依靠實時監控攝像頭和溫度感測器使農民實時了解農作物的情況，使農民按需給予水、農藥和肥料，高效精準地種植農作物。

機器學習演算法和智能化機器人技術變革農業的生產方式，使農作物的種植由傳統依靠經驗和直覺變成依靠數據、分析、預測的精準農業。此外，在農業的收割階段，機器學習也能廣泛地應用，比如蔬果的自動分揀。在傳統的自動水果分類機中，只能按照重量或大小分類，不能同時兼顧大小、賣相等決定水果品質的多維度因素，因而無法解決農民精細分類、精準定價的痛點。

以周忠祥為首的 4 位北京工業大學的學生，決定使用機器視覺技術對水果精確分類，實現智能分揀，以解決果農痛點，減輕他們的負擔。

學生收集數據

使用PaddlePaddle模型訓練，完成桃子多重屬性分類

圖像分類作為智能分揀的核心，是計算機視覺中重要的基本問題，也是物體檢測、圖像分割、物體跟蹤、行為分析等其他高層視覺任務的基礎，在很多領域都有廣泛的應用，比如人臉識別、智能視頻分析、交通場景識別、圖像檢索等等。

在這個過程中，如何提取圖像的特徵至關重要。在深度學習演算法之前，通常使用基於詞袋 (Bag of Words) 模型的物體分類方法。而基於深度學習的圖像分類方法，則可以取代手工設計或選擇圖像特徵的工作。

智能桃子分揀機的團隊也想到了深度學習的方法，但所學專業是機械自動化和土木工程的他們，擅長控制和電路，對機器學習和模型訓練卻較為陌生，因而在模型訓練方面遇到了不少問題。

按照 PaddlePaddle 開源平台上的教程，他們將不同顏色的海洋球進行分類，進行訓練，但模型的準確率並不高，於是他們將問題反饋到 GitHub 上，在 PaddlePaddle 社區值班人員的及時指導下，很快解決了問題，提高了準確率。

最終，團隊將 6400 張大桃照片按照紅、大、中、小等元素按照分檔建立圖片數據集合，將圖片數據集放入卷積神經網路（CNN）中進行訓練，自動提取用於分級的影響要素並形成分類邏輯。實現對大桃的自動分列、判斷、分裝，準確率達到 90% 以上。

桃子數據集

製造的機器則包括軟體和硬體兩部分，軟體涉及數據集採集與演算法訓練。硬體部分分為演算法和下位機主控，包括感測器和動力部分，下位機主控用於完成對 PC 數據和感測器數據的接收，實現對硬體電路的控制工作。

具體來說，主要包含四個部分，傳送帶，推拉裝置，控制電路和一個電腦主機。傳送帶上裝有位置感測器，用於監控桃子在運動過程中幾個關鍵時刻的位置。推拉裝置採用氣動的方式，由一個氣泵給五個氣缸供氣，利用電磁氣動閥控制氣源的通斷。控制電路包含一個主控晶元和電磁閥的驅動電路，供 24v2a 的電源。電腦主機採用一個小巧的 Mac mini 運行 PaddlePaddle 的分類演算法。

機器全圖力主開源，百度與開發者共同推進技術發展

作為百度的開源平台，PaddlePaddle 的前身是百度於 2013 年自主研發的深度學習平台，在內部已使用多年，曾為鳳巢等業務提供支持。

由於開源文化來自西方，的開源氛圍並不濃厚。對大多數人來說，開源社區對他們的作用就是免費提供技術的地方，他們使用技術卻不反哺開源社區，也不願意分享。即使有一些開源項目，但這些開源項目並不活躍。由於缺乏商業環境的支持，這些開源項目也往往無法持續下去，因而形成惡性循環。

作為商業公司的百度卻在積極推動開源文化，陸奇曾經在內部講話中說，開源代碼寫得好，不僅能解決大家的痛點，開源的代碼也會變得越來越強，開源代碼的生命力也必然會超過封閉體系的代碼。

2016 年 9 月的百度世界大會上，時任百度首席科學家吳恩達宣布在開源社區 GitHub 及百度大腦平台上對外開放這個深度學習平台，並命名為 PaddlePaddle。百度成為繼 Google、Facebook、IBM 之後，開源人工智慧技術的又一個科技巨頭，同時也是國內首個開源深度學習平台的科技公司。

PaddlePaddle

在陸奇的主推下，百度傑出科學家徐偉在 2017 百度開發者大會上宣布百度不僅會開源代碼，還會開放大規模數據集、計算能力、應用模型庫。作為國內首個開源深度學習平台，百度在 PaddlePaddle 的研發中持完全開放的態度，試圖與開發者們共同推進技術的發展。

實際上，利用開源機器學習平台製作果蔬分揀器並非只有這一個案例，去年，日本工程師 Makoto Koike 曾使用谷歌的開源工具TensorFlow 和 7000 張黃瓜圖片製作了一個黃瓜分揀器。

目前，如谷歌、Facebook 等科技巨頭都有開源的深度學習平台，而由於百度在搜索、圖像識別、語音語義識別理解、情感分析、機器翻譯、用戶畫像推薦等多領域的業務和技術方向，相較而言，PaddlePaddle 則表現得更加全面，是一個相對全功能的深度學習框架。

除此之外，由於 PaddlePaddle 的定位是易於使用，因而相對 TensorFlow，PaddlePaddle 也更為易用，提供的每個任務都可迅速上手，且大部分任務可直接套用，只需使用現成的演算法 (VGG、ResNet、LSTM、GRU 等等)，按照示例執行命令，替換數據、修改參數就能執行。

此外，PaddlePaddle 可多機多卡并行，同時支持 CPU 和 GPU，顯存佔用空間小，速度比也 TensorFlow 等更快。

作為人工智慧的主要技術，囿於技術門檻，數據量和計算能量等，並不是每個公司都有條件使用機器學習。百度資深科學家、PaddlePaddle 研發負責人徐偉就曾表示：「在 PaddlePaddle 的幫助下，深度學習模型的設計如同編寫偽代碼一樣容易，設計師只需關注模型的高層結構，而無需擔心任何瑣碎的底層問題。未來，程序員可以快速應用深度學習模型來解決醫療、金融等實際問題，讓人工智慧發揮出最大作用。」

在內部力推 PaddlePaddle 開源的陸奇則表示，人工智慧時代的核心是數據和演算法，走向人工智慧，一定會面臨著挑戰。作為百度的核心平台，他希望團隊將 PaddlePaddle 發展成具有特色，尤其是在數據上最適合國情的深度學習平台。

「這是一個時代的演變過程，將來加入人工智慧時代，喚醒萬物，信息一定要傳遍所有的世界的所有的角落。我們要站在這樣的高度來看待。」陸奇說。

陸奇在百度 AI 開發者大會演講

而現在，這 4 位學生已將所有代碼和材料清單，上傳至 GitHub 進行開源和分享，請全世界關注農業和關注深度學習的人共同完善。

對 PaddlePaddle 平台而言，雖然智能桃子分揀器只是其中一個案例，但百度通過人工智慧回饋社會的決心卻明確無疑。

本文為機器之心原創，轉載請聯繫本公眾號獲得授權。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點