search
庫茲韋爾在Google到底負責什麼?從幫你回郵件 到理解人類語言

庫茲韋爾在Google到底負責什麼?從幫你回郵件 到理解人類語言

雷.庫茲韋爾(Ray Kurzweil)近些年為人熟知的身份,是「未來學家」。

提到他,人們可能會想起「奇點」:他最廣為人知的理念,就是未來某一時刻,超級智能機器將會超越、改變人類;除此之外,人們可能還會想到他對長生不老的樂觀預測。

大部分人都快要忘了,他還是Google員工,至於他在Google具體是做什麼的,更是沒幾個人能說出來。

2012年,Google聯合創始人拉里.佩奇把他招募到麾下,不過他在Google的職責和「未來學家」的身份沒有太大關係,而是「做涉及機器學習和語言處理的新項目」、「把自然語言理解帶給Google」。

庫茲韋爾@Google

現在,69歲的庫茲韋爾在Google帶領一個大約35人的團隊,用他們編寫的代碼幫你回郵件。

也就是Gmail的智能回復(Smart Reply)功能。

這個Gmail移動App里的功能可以自動推薦3封回復郵件,供用戶點擊選取,在發送之前還可以對內容進行編輯。他們今年5月面向英語用戶推出了完整服務,上周還將其提供給西班牙語用戶。

雖然回復非常簡單,比如「周一就干」、「哇!太好了!」、「下周再說」。但這些推薦的確很有用。庫茲韋爾說:「這是人工智慧與人類智能密切合作的典範。」

庫茲韋爾說,他的工作才剛剛開始。他的團隊正在嘗試讓智能回復給出更加細緻的建議。點擊「繼續」按鈕,或許就可以對「我肯定願意參加你的聚會!」進行擴展,例如增加「我能帶點什麼嗎?」這樣的內容。

他希望在你輸入文字的過程中讓人工智慧隨時做出貢獻,就像一個無處不在的智能版Google搜索自動完成工具一樣。「利用編寫文檔或郵件過程中使用的技術,也可以針對如何寫句子給出建議。」

展望未來,這些想法最終都將變得微不足道。

他表示,智能回復只是他們主要項目的第一個可以看到的部分:這是一套可以理解語言含義的系統。

這個項目的開發代號是Kona,他們希望開發出語言能力與你我比肩的軟體。「我不能說現在達到人類水平,但我認為會達到。」他說。

你應該相信他嗎?這要取決於你是否相信庫茲韋爾已經破解了人類智能運作方式的謎團。

志趣相投?

Google聯合創始人拉里.佩奇(Larry Page)在2011年至2013年二次出任CEO期間管理了一些出人意料的項目,其中包括大舉收購機器人公司,組建了一個希望實現長生不老的部門,以及已經夭折的Google駁船。

2012年聘用庫茲韋爾,也算得上是這些令人費解的決定中的一個。

該公司已經擁有一批最具影響力的機器學習和人工智慧學者,而且還在快速擴張技術團隊,開發各種機器學習系統來支持新產品。庫茲韋爾曾經出版過很多預測未來的書籍,他說你有朝一日可以將自己的意識上傳到網路空間,但他似乎並不擅長開人工智慧系統。

庫茲韋爾表示,正是自己的一本書讓他得以加盟Google。佩奇當時給他打電話,探討了那時即將出版的《如何創造思維》(How to Create a Mind)一書中的內容。這本2012年出版的書籍闡述了庫茲韋爾關於新皮質運作方式的理論——作為大腦的外層,這裡正是人類智能所在的地方。

「他們招我的目的就是將這個論點帶到Google。」庫茲韋爾說,「我將這種模型應用到機器學習,使之非常擅長理解語言。」

庫茲韋爾的論點是,新皮質由許多重複單元構成,每一個都有能力識別信息模式,然後堆疊成層級結構。他表示,這讓很多不那麼聰明的模塊可以共同展示出抽象和推理能力,而這恰恰是人類智能的獨特之處。

這種模式尚未被研究人類大腦的學者普遍接受。當認知科學教授加里.馬庫斯(Gary Marcus)看過《如何創造思維》一書時,他發現這番理論不僅不是原創,而且停留在經驗主義的範疇。庫茲韋爾表示,這本書提取了他從14歲以來逐漸形成的關於大腦的思考。他對馬庫斯的說法持不同意見。

「其實出現了很多神經系統科學證據來支持我的論點。」他說。他表示,自己的智能層級理論成為Kona系統的指導思想,而且已經應用在智能回復功能中。

重新開始

雖然庫茲韋爾團隊開發的代碼為智能回復提供支持,但這項功能並不是他們開發的。它的發明人是Gmail產品團隊和Google Brain人工智慧實驗室的工程師和研究員。

Google的圖片搜索和語音識別服務都早就用上了神經網路,他們還證明了只要有充足的樣例,這項技術就可以用來自動回複電子郵件。

2015年末,這套系統被添加到Gmail的一款移動客戶端Inbox里。大約6個月後,通過Inbox應用發送的郵件中,約有10%使用智能回復功能。

然後,庫茲韋爾的團隊幫助把智能回復功能部署到更常用的Gmail應用中。

Google的伺服器很充足,但電費是一筆不小的開銷,而最初的智能回復功能需要消耗大量計算資源。它使用一種具備短期記憶的神經網路,使之可以理解單詞排列的順序。這項技術很擅長理解句子含義——已經應用到Google翻譯中——但的確要耗費很多計算資源。

「庫茲韋爾化」的智能回復也使用神經網路,但他們並不關心單詞順序,因此運行成本更低。

這個程序會一次性把電子郵件正文和主題中的單詞分解成數字。它還有神經網路堆疊成兩層結構。底層負責吸收電子郵件的文本,頂層則負責合成結果——從2.9萬條預先寫好的選項中選擇最合適的內容,這些內容都是通過對Gmail用戶最常用的短語進行分析后形成的。

在今年5月發表的論文中,庫茲韋爾和他的同事表示,他們的系統只是用了很少的計算資源就實現了同樣的流行度。

上面提到的論文:Efficient Natural Language Response Suggestion for Smart Reply

地址:https://arxiv.org/abs/1705.00652

有待證實

智能回復或許令人印象深刻,但要證明自己的軟體更擅長理解語言,庫茲韋爾的團隊仍有很多工作要做。

特拉維夫巴伊蘭大學的自然語言處理專家Yoav Goldberg表示,Google針對智能回復系統發表的論文只是闡述了了不起的工程實力,而不是科學突破。

為了把機器學習應用到生活的方方面面,Google每天都在做這樣的事情。「對多數問題來說,我們需要的是使用既定技術開發良好的解決方案,而不是突破性的新方法。」他說。

庫茲韋爾在他團隊的系統與人腦之間進行的類比究竟是否正確,目前還難以判斷。

的確有一個相似成分組成的層級結構將數據進行抽象化處理,從而制定決策。然而,可以用這樣的方式描述任何一個使用人工神經網路的機器學習系統,但其中卻沒有任何一個真的很像大腦。「我發現這種類比很不嚴謹,實際上毫無意義。」Goldberg說。

不過,庫茲韋爾似乎很淡定,他堅信自己的理念是正確的。「使用的數學方法不同,但我認為新皮層的運作就是遵循著同樣的概念。」他說,「根據我們的測試,這的確抓住了語言的關鍵。」

他承諾,還有更多基於Kona的應用正在開發之中,今後也將出現在Google產品中。

在被問及對未來的展望時,他給出了一個令人興奮的預測:「我幾十年來始終如一的預測是,到2029年,電腦對語言的理解力將達到人類的水平。」

倘若真的實現,庫茲韋爾的代碼所能完成的任務絕不僅僅是撰寫電子郵件這麼簡單。

——完——

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23312次喜歡
留言回覆
回覆
精彩推薦