search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

人工智慧系列報告(一)——何為人工智慧?

人工智慧是信息時代的尖端科技,人工智慧、機器人和自動駕駛已成為流行文化的前沿,甚至是政治表述。我們將從這篇高盛的報告里看到,宏觀(更多更快的計算和更多數據的爆炸式增長)和更加微觀方面(在深度學習方面的有益進展,智能硬體和開源方面的增長)的拐點的原因。

人工智慧是什麼?

人工智慧是製造智能機器、 可學習計算程序和需要人類智慧解決問題的科學和工程。 經典地,這些包括自然語言處理和翻譯,視覺感知,模式識別,決策制定等,但應用的數量和複雜性在快速增長。

二個關鍵點:

1、簡化地,機器學習是從案例和經驗(例如數據配置)中習得的演算法,而不是依賴於硬體代碼和事先定義的規則。換句話說,不是一個開發者來告訴程序如何區分蘋果和橘子,而是演算法本身通過餵養數據(訓練) ,自己學會如何區分蘋果和橘子。

2、深度學習的主要發展是現有人工智慧拐點的驅動力量之一。 深度學習是機器學習的分集。大多數傳統機器學習方法和特點(例如,可能預測的輸入和屬性)由人來設計。特徵工程是一個瓶頸, 需要有意義的特定技術。 在無人管理的深度學習中, 重要特徵不是由人類來定義,而是由演算法學習和創建。

什麼是神經網路?

神經網路在 AI /機器學習的中充當一種模擬人類大腦的計算機體系結構,在其上可以構建AI /機器學習程序。它由聚合的連接節點組成,如人類大腦中的神經元般可以解決更複雜的問題並學習。

什麼是深度學習?深度學習是一種需要訓練大型神經網路的「深層」層次結構,且每層可以解決問題不同方面的機器學習, 從而使系統能解決更複雜問題的。 使用上面說到的火車的例子,深層學習系統包含了識別火車的不同特徵的各個層。例如,底層將標識是否具有窗戶。

如果答案是肯定的,下一層將尋找是否有輪子,接下來將會識別是否是長方形的車等等。直到這些層共同地將圖片識別為火車或徹底否定。 隨著技術發展, 可以支持大型神經網路的訓練,深度學習作為增強機器學習能力的方法已經越來越普遍。

什麼是監督學習?無監督學習?監督和非監督學習是機器學習的兩種類型。

在監督學習中,系統給出一系列「正確答案」的例子。基於這些例子,系統將從正確的答案中學習什麼是對的,從而進行正確預測的輸出。監督學習的現實應用包括垃圾郵件的檢測(例如,系統可能有一組標記為「垃圾郵件」並且學習正確識別垃圾郵件的電子郵件)和手寫識別。

在無監督學習中,系統沒有給出正確的答案,而是提供需要自己去發現特徵的未標記示例。一個示例將基於大量客戶數據中發現的, 包括可以將客戶分組的某些特徵 (例如, 購買頻率) 。

什麼是一些類型的機器學習?

  • 分類 將電子郵件歸類為垃圾郵件,識別欺詐,面部識別,語音識別等。

  • 聚類 對比圖像,文本或語音找到相似的項目;識別異常行為的集群。

  • 預測 基於網路活動和其他元數據預測客戶或員工流失的可能性; 基於可穿戴數據預測健康問題。

什麼是通用,強大或真實的人工智慧? 通用,強大或真實人工智慧是,機器智能演算法完全複製人類智慧, 包括人類的獨立學習和決策能力。 雖然像全腦模擬這樣的技術被用於實現通用 AI 的目標,但是其所需的計算能力數量,仍然遠遠超出了當前的技術,使得通用的人工智慧基本只存在於理論層面。

為什麼現在人工智慧加速發展?

請記住, 我們並不關注於重複獨立人類智能且在流行文化中常見的真實、 強壯或普遍的人工智慧。必然存在潛在突破點,例如谷歌深度思維 AlphaGo 系統,不僅擊敗了世界冠軍,而且使用了沒有人曾經做過的行為,我們關注人工智慧即刻可觸達的經濟發展領域。

深度學習能力方面的主要飛躍成為當前進行中的 AI 拐點的催化劑。神經網路,深度學習之後潛在的科技架構,已經存在了幾十年,但是過去的 5 到 10 年,三件事發生了改變。

1、據數。 通過分佈於全球持續增長無所不在的互相聯繫的設備、 機器和系統產生的非結構化數據的數量呈現巨大的增長。擁有的數據越多,神經網路就變得越有效率,意味著隨著數據量的增長,機器語言可以解決的問題的數量也在增長。移動手機、物聯網、低耗數據存儲的成熟和處理技術(通常在雲端)已經在數量、大小、可靠數據結構方面創造了大量的成長。例如,特斯拉至今已經搜集了780mn 英里的駕駛數據,並且每 10 小時通過它連接的汽車增加百萬公里的數據。Jasper(2016 年 2 月被思科以 14 億美元收購)擁有一個平台驅動機器和機器的溝通, 服務於多種汽車製造商和電話公司。Verizon在8月進行了一次類似的投資,宣布收購 Fleetmatics,它通過快速增長的無線網路,連接運輸工具上的遠程感測器到雲端軟體。5G 的首次展示將最適當地加速數據可被獲取和轉移的機率。根據 IDC 的數字領域報告,到 2020 年,每年數據量將達到 44ZB(萬億 G) ,5 年內年複合增長率達到 141%,暗示我們剛開始看到這些科技可以達到的應用場景。

2、更快的硬體。GPU 的再次使用、低成本計算能力的普遍化,特別是通過雲服務,以及建立新的神經網路模型, 已經極大的增加了神經網路產生結果的速度與準確率。 GPU 和并行架構要比傳統的基於數據中心架構的 CPU 能更快的訓練機器學習系統。通過使用圖像晶元,網路能更快的迭代,能在短期內進行更準確的訓練。同時,特製硅的發展,比如微軟和百度使用的 FPGA,能夠用訓練出的深度學習系統做更快的推斷。另外,從 1993 年開始超級計算機的原計算能力有了極大發展 (圖 2) 。 在 2016 年, 單張英偉達遊戲顯卡就有了類似於 2002 年之前最強大的超級計算機擁有的計算能力。 成本也有了極大的降低。 英偉達 GPU (GTX 1080)有 9 TFLOPS 的性能,只要 700 美元,意味著每 GFLOPS 只要 8 美分。在 1961 年,要提供1GFLOPS,需要足夠多的 IBM 1620s 串聯在一起,計算下來費用要超過 9 萬億美元(根據通貨膨脹調整) 。

3、更好、更普遍可用的演算法。更好的輸入(計算和數據)使得更多的研發是面向演算法,從而支持深度學習的使用。例如伯克利的 Caffe、谷歌的 TensorFlow 和 Torch 這樣的開源框架。比如,剛開源一周年的 TensorFlow,已經成為最大的開發人員協作網站 GitHub 上最多分支(或活動)的框架。雖然不是所有的人工智慧都發生於普遍可用的開源框架中,但開源確實在加速發展,而且也有更多先進的工具正在開源。

方向

雖然本報告的重點是人工智慧的發展方向以及公司如何把握這個方向, 但是了解人工智慧對我們生活的影響程度也是很重要的。

1、在線搜索。就在一年多以前, 谷歌透露, 它們已經開始將大量的搜索工作移植到了 RankBrain(一個人工智慧系統) ,使其與鏈接(links)以及內容(content)成為了谷歌搜索演算法的三個最重要的標誌。

2、推薦引擎。 Netflix, 亞馬遜和 Pandora 都在使用人工智慧來確定推薦什麼樣的電影和歌曲,突出哪些產品。 5 月, 亞馬遜開源了它們的深度可擴展稀疏感測網路引擎 (the Deep Scalable Sparse Tensor Network Engine(DSSTNE) ,簡稱「Destiny」 ) ,它被用於產品推薦,同時可以被擴展,以實現超越語言和語言理解的目的。

3、人臉識別。Google(FaceNet)和 Facebook(DeepFace)都投入了大量的技術,來確定照片中的臉和真實的臉是不是完全吻合。1 月,蘋果採取了進一步措施,購買了 Emotient(一個致力於通過讀取人的面部表情來確定其情緒狀態的 AI 創業公司)顯然,這些技術遠遠不止於對照片進行標記。

雖然個人助理應用產品有無數的用戶,比如蘋果的 Siri,信用貸,保險風險評估,甚至天氣預測。在接下來的篇幅中,我們探討企業該如何使用這些技術來加速增長,降低成本和控制風險。 從這些技術及其使用這些技術的應用的發展速度來看, 它們充其量不過可以為公司和投資者提供一些方向,以保持他們的競爭力。

價值創造的主要驅動力

經過深入分析,我們認為與 AI 主題相關的利潤創造(和損失)可以分解為四個關鍵輸入:人才,數據,基礎設施和硅。這些投入也同時也是進入的壁壘。

AI(特別是深度學習)難度很大。根據我們與領域中的風險投資公司和公司的對話,這種困難造成了人才短缺,以及大型互聯網和雲計算供應商對這類人才的競爭(見圖 5) 。 對於 AI 人才的高度需求意味著獲取必要的 AI 人才。 隨著技術和工具的成熟, 人才可能變得不再是瓶頸。然而,我們相信人才會遷移到有趣的,差異化的數據集。因此,我們認為,當我們進入一個以 AI 為中心的世界時, 大的差異化數據集是最可能的提高和增加利潤的驅動力。

數據:數據是 AI 的關鍵輸入。深度學習效果與大數據集緊密相關,因為更大的數據集會阻礙模型過度擬合。 例如, 來自馬薩諸塞州總醫院和哈佛醫學院放射科的研究人員使用卷積神經網路來識別 CT 圖像, 基於訓練數據大小來評估神經網路的準確性。 隨著訓練規模的增大,精度將被提高 。

今天的大多數深度學習是監督的或半監督的, 意味著用於訓練模型的所有或一些數據必須由人標記。無監督的機器學習是 AI 中當前的「聖杯」 ,因為可以利用原始未標記的數據來訓練模型。廣泛採用深度學習可能與大數據集(這是由於移動互聯網和物聯網產生)的增長以及無人監督的機器學習的發展有關。然而,我們認為大型差異化數據集(電子健康記錄,組學數據,地質數據,天氣數據等)可能是未來十年企業利潤創造的核心驅動力。

參考 IDC 報告,全世界創造的信息量預計到 2020 年將以 36%的複合年增長率增長,達到 44 澤位元組(440 億 GB) 。連接的設備(消費者和工業領域) ,機器到機器通信和遠程感測器的增加和組合可以創建大型數據集, 然後可以挖掘洞察和訓練自適應演算法。 在過去十年中,數據的可用性也大大增加,人口普查,勞動力,天氣,甚至基因組數據可大量的免費在線查詢。

我們還留意到衛星圖像的可用性增加, 這需要大量的計算來支撐全方位的分析。 美國地質調查局的 Landsat 7 和 Landsat 8 衛星每 8 天對整個地球進行成像,USGS 使這些圖像可以免費使用 - 即使是在壓縮時,超高清圖像的文件大小也各為 1GB 左右。其他公司,如Orbital Insights,正在匯總圖像數據並在多個行業創建商業解決方案。 基礎設施: 硬體和基礎設施軟體是開展 AI 工作所必需的。 我們認為支持 AI 的基礎設施將被迅速商品化。這個觀點基於兩個現象觀察:1)雲計算供應商能夠將他們的產品擴展到 AI基礎設施中,2)開源(TensorFlow,Caffe,Spark 等)已經成為 AI 中軟體創新的主要驅動力。為了促進 AI 技術的應用,我們認為大型雲供應商將繼續開放基礎架構資源,這將限制利潤創造的潛力。

硅技術:GPU 在深度學習領域的新用途成為我們目前 AI 春天的核心驅動力之一。在人工智慧、機器學習生態系統中,存在二個主要應用來決定神經網路的表現,每個神經網路需要不同的資源。首先是學習演算法的構造和使用。學習演算法藉助大數據(通常更大、更好)發現相互聯繫,並且創建模型,提供新輸入,可以決定輸出的可能性。學習是資源密集型,並且大多數現代學習通過 GPU 驅動的系統來運行。 一旦經過學習, 模型和演算法的使用將被稱為推論。推論需要更少的計算資源, 經常通過更小增量數量輸入進行梳理。 一些 GPU 被優化用於推論(例如英偉達 P4 系列和 M4 系列) ,給出單目標的自然推論。

矽谷有針對性地發展用於該應用的專業技術,例如 FPGAs(現場可編程門陣列)和 ASICs(專用集成電路) 。這種類型的集成電路被獨創地用於原型機 CPU 中, 但是逐漸地被應用於人工智慧推論。 谷歌的張量處理單元就是 ASIC 應用於 AI 和機器學習的一個例子。 微軟也在將 FPGA 應用於推論。 英特爾在 2015年收購了 FPGA 製造商 Altera,有觀點認為,到 2020 年,三分之一的數據中心將在特殊定製化應用中使用 FPGA。 賽靈思在 1980 年開發了可商業化的 FPGA, 領先提出了雲和大數據將做為有價值的增長途徑,宣布和百度達成戰略協作關係。數據中心業務大概占賽靈思 5%的營業收入。

主要影響

1、促進未來生產力

在經歷了 90 年代中後期的高速發展和過去十年的平緩增長后,美國的勞動生產力近幾年已經進入了增長停滯的階段。 我們相信實用的機器學習和人工智慧的蓬勃發展可以將生產力典範作用廣泛推廣至全球各產業領域。

人工智慧和機器學習帶來的自動化及效率提升在普遍各領域都縮減了約 0.5%-1.5%的勞動工時,預計到 2025 年將帶來 51-154 比特/秒的生產力提升。 在期待未來人工智慧和機器學習得以同時提升生產效率的分子和分母 (標準工時和實際投入工時) ,最重要的是它帶來的早期影響將會體現在低薪工作的自動化層面,用更少的工時驅動同比產出增長。我們基本認為人工智慧和機器學習提速 97 比特/秒意味著在 2025 年 IT將為生產率增長貢獻 1.16%效能,也即比 1995-2004 提高 11 比特/秒。

2、技術與生產力增長

90 年代掀起的科技熱潮伴隨著生產力、資本深化和多因素生產力被異常放大,並與飛漲的股票估值緊密關聯。

3、資本深化

高盛的經濟學家 Jan Hazius 提供了他近期就資本深化(每工時資本量)反周期性趨勢的分析, 在擴張時期沒有同等水平股本增長的情況下歷史勞動工時一般趨於增長 (參見 Jan 的報告: 「生產率悖論 2.0 版本再探」 2016 年 2 月 9 日發表)90 年代資本深化急劇增長,其中最顯著的是非典型資本投資的增長超越了勞動力市場的增長。

4、多因素生產力 (MFP)

2013 年 3 月,美聯儲研究的大衛 · 伯恩等研究后發現,90 年代在 IT 生產和一般操作流程中同時推廣技術有助於促進增長呈三倍激增 (每勞動工時的產出) ,其中從科技熱潮前到1995至2004之間, 年生產率平均每年增長中不超過49%的部分來自於IT 生產部門。

5、千禧年後停滯期

在過去的十年中,有關 IT 應用 (計算機硬體、 軟體和電信) 的資本深化增長已經停滯了。IT 資本,與更廣泛的市場資本類似,帶來 IT 部分整體增長相比科技浪潮甚至其之前的時期內還低。 總勞動時間一直在增加, 但資本強度對生產力的貢獻已經遠遠落後於上世紀 90 年代。 日益精細且可利用的機器學習和人工智慧可能成為一劑催化劑將資本密集度帶回最前沿,在我們看來,將會帶來類似 90 年代所看到的周期階段,極大增加勞動生產率。

對於方程另一側的 MFP, 我們更樂觀些。 高盛經濟學家強調 ( 「生產率悖論 2.0 再探」 2016年 2 月 9 日發表) ,ICT 價格的正偏差,非貨幣產出的輸入增長 (免費的在線內容、 後端流程等) 也在一定程度上反映了實際 GDP 和生產力增長。Facebook 和谷歌等互聯網巨頭的發展充分說明了複雜輸入的勞動力和資本並不必然將標準生產力指標中的傳統消費品轉換為貨幣。

6、人工智慧/機器學習激發的生產力可以影響投資

我們認為人工智慧/機器學習所帶來日益增長的生產力產生的潛在影響之一可能是公司資本分配方式的轉變。自 2011 年中期,股息和股票回購的增長大大超過了資本支出增長,然而管理層對於投資資本項目的冷淡依然保持了經濟衰退後期的狀態。 生產率的提高有可能恢復管理層的信心, 並鼓勵公司像上世紀 90 年代一樣投資於生產性資本。根據高盛資本支出追蹤,90 年代資本支出同比增長,持續性高於耶魯大學教授羅伯特 · 希勒的 S & P 500 分析報告中的同比股息增長。我們有理由更相信投資者會支持提高生產率的這種轉變。 在資本支出投資和相關生產率的增長期內周期性調整股價收益率經歷了嚴重的通貨膨脹,而目前的估值才剛剛達到經濟衰退前水平。

*關注下方「松樹資本」,獲取更多精彩。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦