search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

竹間智能簡仁賢:打破千篇一律的聊天機器人 | Chatbot 的潮流

雷鋒網按:從問答系統開始,聊天機器人已經存在了幾十年。但只有在過去三四年內,如何讓機器與人流暢自然地對話才成為商業公司尤其是國內互聯網公司重金投入的熱點。從微軟小冰、百度度秘到各個垂直行業成熟的客服機器人,這些聊天機器人形態各異,又不乏共性。

雷鋒網試圖在一個系列採訪里找到國內典型 Chatbot 公司形成的原因,以及他們所看見的商業機會。本文是雷鋒網對竹間智能科技 CEO 簡仁賢的採訪整理。在創業前,簡仁賢是微軟亞洲工程院最高級別的負責人之一,其參與和向其彙報的項目包括了 Bing 亞洲地區的戰略與合作夥伴關係,微軟的虛擬助手小娜以及亞洲地區的商業變現業務。創業之後,簡仁賢的竹間智能今天已經擴張到一百多人。簡仁賢認為竹間做得大致就是一件事:讓機器讀懂語境,讀懂人的情緒和情感,繼而與人自然地發生對話。

周一晚上大約 8 點,簡仁賢在對面的椅子上坐定開始接受採訪。這個採訪之後,他在 9 點多還有一個產品會議。他低沉的嗓音不時被咳嗽打斷,但他的表情中沒有顯露出明顯的疲倦。創業一年多后,談到聊天機器人 Chatbot 和情感計算,他的大部分回答是明確有力的。上面與簡仁賢對話中的這些判斷,一個普通人容易從語調、動作、表情甚至環境中去捕捉到;但對機器來說,這個過程就很複雜。而他設想中的聊天機器人還不止於做到這些。

一、Chatbot 的歷史

聊天機器人 Chatbot 存在很久了,從我學生的時代就有。我自己寫過一個機器人問答的程序。其實很簡單,問答系統是找關鍵字,一個字兩個字合起來,就可以找回來一句話。Chatbot,應該說一直有人在做,但是都是作為 exercise,從未真正 popular。

我覺得 Chatbot 可以做了,那是我還在美國,是搜索最紅的時候。05-10 年中間,當搜索需求最旺盛的時候,我就覺得,Chatbot 應該是有未來的。

為什麼?因為搜索一直處於用戶輸入一個關鍵詞,返回多個鏈接多個結果的情景。以前美國有一家公司叫 ASK.COM,在 2000 年初期就已經出來了。它是第一個公開的自然語言問答的系統,而不是檢索。用戶是以一句話問句的形式,找到他想要的信息。相比關鍵詞和鏈接,這個時候,它就比搜索更進步一點,自然一點。

但中間有很多年,這樣問答的系統其實沒有流行起來,也沒有讓人能夠覺得 Chatbot 是有用的。因為一個機器人,如果讓人覺得它有用:要讓人在用它的時候,覺得很智能,如果問一句、兩句,答不上來,人就不會再來用了。當人把一個東西定義成一個小玩具的時候,就不會再回來了。

所以 Chatbot 在過去幾十年來,雖然說有人拿它來做 exercise,有人拿它做 academic,就是沒有普通人再用。

二、技術並不是根本問題,理念才是根本問題

再讓我想重拾 Chatbot,是蠻長時間以後了。我在 2012 - 2013 年接觸到《Her》這部電影,我覺得電影里的景象是可以實現的。她有很多人性在裡面,而不是單純的一個機器人。一個 Chatbot 可以懂你,可以有人性。但是她有人性之前,她必須要先懂情感,我覺得這裡面有很多可以做的。

我那時候認為,機器人的定義要重寫了。但即使現在,4 年過去了,市面上還是有很多一問一答的程序,還很機械,用關鍵詞、關鍵字去查找。現在很多市面上的機器人談不上 AI,都只是一個傳統技術里商業化的工具而已。

那時候,在技術上也沒有像現在成熟。但在我的職業生涯裡面,技術永遠不是難點。因為我們學技術的,認為什麼事情只要能夠講得出來,大概都有方法實現,只是實現時間的先後長短而已。

所以技術不是根本問題,問題是觀念、理念,是你對 Chatbot 的看法。如果你認為 Chatbot 還是一問一答的,很機械化的,那麼你技術再高端,做出來還是一問一答;如果你能夠想象 Chatbot 是具有感情,那麼機器人就可以懂你。

聽起來,好像每個人都是有這個願景的。但在實現上,有的人並沒有朝著這個方向去做。這個不是技術的問題,是設計觀念的問題。比如說微信剛出來的時候沒幾個功能,跟其他的聊天平台一樣,在聊天平台的開發上,技術不是難點。但有幾個能夠像微信做得那麼成功?如果 Chatbot 只是技術的融合,每一個做出來的 Chatbot 都一樣的,每一個人做出來的 IM 應該也跟微信一模一樣。不是的。

我們再看 Chatbot 的時候,我們設計的思路,架構的思路,演算法的思路,是不是按照人性化的方式去走,這很重要。如果說雖然願景是往人性化走,可是架構、演算法、開發還是走捷徑,那麼做出來的還是跟 20、30 年前的 Chatbot 沒什麼兩樣。

三、情感機器人的建模

做一個有人性的機器人,能夠了解你,有情感。

第一,要從情感機制上去著手。有多少做機器人的團隊真的去投入情感計算?大家都是投入做語料庫、做詞向量、再做一個檢索,有沒有人想過如何做好一個情感計算嗎?如果有人要把一個 Chatbot 做好,要模擬人性,模擬人的行為,包括理解人的行為模型,讓 Chatbot 能夠有人性地互動。

對人性和情感的建模,有幾個方法可以做。一種是計算認知科學的方法。它也可以從邏輯的模型演變成機器學習的模型。所以一個是邏輯去模擬人的情感和行為,一個用是機器學習的模型去預測。

當你對我不滿的時候我應該怎麼應對,當你無聊,跟我說你很煩的時候,我應該怎麼應對,當沒話講的時候,我應該怎麼應對。

第一,要能夠辨識這樣的狀態;第二要能夠應對這樣的狀態,如何在不合適的狀態之後,做自我學習調整,成為一個好的狀態。這就需要結合邏輯模型跟機器學習模型的方法。

另一方面機器學習自己可以去製造很多交互的數據,這個交互數據產生一個好的交互模型,用交互模型再讓機器能夠對應不同的情緒狀態。把這兩個結合起來,就能夠模擬人的交互,跟人的行為。

重要的一點是,你的 Chatbot 能夠對情感進行識別和理解,要能夠對話的主題理解,要對意圖理解,要對整個語言上很多不同的信息理解,你才有辦法做出一個真正懂人的機器人。

四、Chatbot 的商業

這幾年來,信息通訊平台的流行,包括從以前 QQ 到現在的微信、國外的 LINE、Facebook Messenger 還有其他的聊天平台盛行。人類在這幾年來,已經對聊天行為習慣了。人的行為變了。如果人的行為沒變,那麼今天聊天機器人的接受度也不可能那麼高。

基礎技術也進步了,包括機器學習的工具、平台進步了,深度學習也進步了。你要一個 RNN 的模型,谷歌幫你寫好了,TensorFlow幫你寫好了。你不用一個代碼一個代碼去敲,只要專註於你的模型就可以了。同樣的,在工具、技術裡面,大家的心得也豐富了,這部分的技術理論迭代非常快,所以技術方面是成熟的。

第三個,有很多數據,最珍貴的數據不是從網路來的。最珍貴的數據是自身產生的數據。但是從網路來的數據是冷啟動的關鍵,扒來的數據清洗,清洗之後整理,整理之後做標記等等。數據存儲的成本也降低了,GPU 越來越便宜,GPU 一年可以 3 倍速度增長,在不漲價的情況下,性能可以提升 3 - 4 倍, 3 年會提升 20、30 倍。

在這幾個前提下,我覺得現在是做聊天機器人最佳的時候。甚至不是現在,在兩年多以前就是了。像微軟小冰在 2013 年底 - 2014 年初就已經開始了,這些準備條件都已經存在了。

而我想做的情感機器人跟小冰是相反的,是完全可定製化的。讓每一個人可以有自己的機器人,每一個商家可以有自己的機器人。我想做出來一個機器人工廠,它是可以製造很多情感機器人,不是只有一個。

機器人不僅僅只是一個 IP,比如迪士尼的米老鼠,它不可能成為其他商家的代言人,因為事實上只有一個迪士尼。每一個商家都有屬於自己的品牌,所以每一個商家都應該擁有屬於自己的機器人。

如果真的想把機器人推向各個地方,它需要有情感,懂你,可以 「記憶」。這個機器人會記憶 「你」,還有你周圍的人,圍繞你去學習。這個機器人會和你一起成長。

構建這樣一個機器人,分很多步,需要比較大的資源。我們要從平台開始做起,其實是一個 10 年計劃。

第一個要先能夠證明,聊天機器人能跟人產生黏性,如果產生黏性,就要取得人的信任。機器人在過去幾十年來,為什麼一直沒有辦法為人所信任,因為,它就是不夠智能。只會閑聊,是不可能有黏性的。會閑聊之後,Chatbot 能夠幫人做到什麼,這樣才有辦法達到更強的黏性,情感跟功能理性地結合。

其次聊天機器人必須要在人的生活上,能夠起到幫助的作用,必須要跟商業去打通結合。要不然,它可以幫你查天氣,可以幫你做搜索,但是沒有辦法在其他的業務上幫你服務,Chatbot 也沒有辦法跟人產生黏性。只會閑聊,是不可能有黏性的。

我覺得一個完整的懂人性的機器人,這個夢想可能要 10 年才能達到。下一個,它可能要要淘汰掉搜索,甚至於取代 App 一些的入口的。這個過程,在未來的演變里,是一定要發生的。

點擊關鍵詞可查看相關歷史文章

近期熱門

上線兩個月,微信小程序給人們帶來了什麼?

谷歌收購 Kaggle 為什麼會震動三界?

人工智慧被寫進政府工作報告意味著什麼?

多達 20 位核心人才出走,特斯拉緊繃的神經要斷了?

今日頭條的引擎是怎麼樣工作的?

暗網買信用卡紀實:親測盜刷無門檻

5G 比 4G 強在哪?看完這篇文章你就明白了



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦