Zi 字媒體

專訪德撲AI背後專家:人機戰不靠深度學習靠「談判」

2021/12/25

yidianzixun

新浪科技周峰

卡內基梅隆大學計算機科學學院院長安德魯·摩爾接受採訪

冷撲大師沒有使用深度學習，這多少有點風水輪流轉的意思。

4月6日，在美國擊敗人類頂尖德州撲克選手的人工智慧Liberatus接受創新工場邀請，化名「冷撲大師」，將在海南挑戰職業德州撲克選手組成的「龍之隊」。賽前在接受新浪科技專訪時，開發冷撲大師的卡內基梅隆大學計算機科學學院院長安德魯·摩爾（Andrew Moore）揭示了在另一場人機大戰中，戰勝人類背後的基本原理：更加古老的線性規劃（Liner Programming）。

在解決面對不完整信息，獲得最佳策略的問題方面，線性規劃早就已經成為重要方法。在微觀經濟學和商業管理領域當中，這種演算法已經被大量應用在降低生產流程成本。而在人工智慧領域，它和深度學習火熱之前的主流：貝葉斯網路技術息息相關，而後者也目前互聯網的通用基礎技術之一。

2017年1月11日，職業撲克選手賈森·萊斯（Jason Les）在與Libratus較量德州撲克。1月30日，卡內基梅隆大學開發的人工智慧結束了與4名頂尖德州撲克選手之間的比賽，取得勝利。

在採訪開始前，摩爾表示，德州撲克遊戲中包含了大量的隱藏信息，在本質上就是一種談判。而通過人工智慧談判其實是卡內基梅隆大學研究團隊的初衷。他表示，贏得撲克遊戲勝利能讓人感覺人工智慧非常厲害，但他也很期待人工智慧能夠在協商談判並解決問題方面湧現出更多應用。

以下為部分採訪實錄，新浪科技整理：

新浪科技：冷撲大師好像和AlphaGo不一樣，沒有從人類玩牌的結果中學習。德州撲克人工智慧和圍棋人工智慧有哪些不同？

安德魯·摩爾（以下簡稱AM）：撲克是一個規則非常簡單的遊戲，但是有很多隱藏信息，而圍棋沒有隱藏信息，所以做圍棋方面的人工智慧，需要進行非常深度的棋譜搜索。而做撲克遊戲的人工智慧要面對的問題是有非常多的詐唬策略要一一考慮。

新浪科技：冷撲大師有沒有使用到神經網路和深度學習技術？

AM：冷撲大師沒有使用神經網路和深度學習方面的技術，而是使用了最為傳統的線性規劃（Liner Programming）。

我可以講得稍微細一點。計算機需要算出最合適數量的詐，因為無論詐數量過多或者過少，都可能被其他牌手利用。數學家約翰·納什曾經計算出的一個等式來解決類似的問題，但是要想真的計算出最合適數量的詐，這個等式可能會有無數的變數，而我們在冷撲大師身上應用的計算機技術可以得出最接近正確答案的解決方式。

新浪科技：李開復之前寫過自己玩德州撲克的感受，他說想要玩好，就要把人性擺在一邊。冷撲大師在比賽時是靠算牌，還是用統計方式研究對手打心理戰？

AM：算牌是贏牌的正確方式。不過這樣做的計算量很大，冷撲大師需要完成1000萬小時的計算才能形成它的策略。

但用統計數據來研究對手玩法不是一個好辦法，因為一旦我知道你在統計我的玩法，我就會故意使用變換押注方法，實際上可以繞開你。

所以就像我剛才說的，冷撲大師沒有使用心理戰贏牌的企圖，只是使用數學方法而已。

實際上過去十年是大數據和機器學習發展的十年。但冷撲大師所用的線性規劃與這兩者有很大不同，它是實現最優解（Big Optimization）的技術，相信未來的技術前沿也是實現最優解的技術。

4月6日，6位華人牌手組成的龍之隊將在海南挑戰Libratus。但隊長杜悅（左四）表示，龍之隊的勝算可能只有10%。

新浪科技：和龍之隊比賽的賽制，與常見的多人德州撲克牌局不同。為什麼會選擇一對一形式的比賽？是和演算法限制有關嗎？

AM：德州撲克中最考驗牌手技術的反而是雙人對戰，如果有更多牌手的話，其他牌手間的技術差別反而會被利用。

新浪科技：除了德州撲克之外，冷撲大師所採用的技術還可以用在哪些領域？

AM：我最喜歡的商業用途當然是商業談判，可以通過人工智慧來實現在最合適的時間，以最合適的價格找到最合適的供應商。

談判其實是非完整信息博弈理論中一個不錯的例子，因為談判的時候，我們不一定會透露真實的想法。我們的研究人員認為計算機能夠與人類或者其他計算機進行交談和談判的能力非常重要。計算機的這種能力就是我們下一個研究方向。

實際上，除了德州撲克之外，相同演算法還可以幫助很多需要器官移植的人，比方說Kidney Exchange。在美國，這個演算法每年能幫助數百位患者實現腎臟移植的匹配。

新浪科技：所以冷撲大師背後的技術實際上是通用的。

AM：冷撲大師所採用的技術確實可以應用到其他領域，來幫助人類找回丟失掉的信息。比如購買一間公寓，這就是一個談判過程。如果我聘請的人類房產中介直接告訴賣家我願意出多少錢買他的房子，那我肯定馬上炒他的魷魚。因為他的工作就是在隱藏我信息的前提下，和賣家達成交易。

新浪科技：怎麼看待的人工智慧市場？對人工智慧開發者有什麼建議？

AM：從投資數量上能看出人工智慧市場的發展是多麼欣欣向榮。這是非常明智的投資，因為各行各業的自動化是未來經濟增長的強勁動力。

但是，我認為一般意義上的人工智慧技術工具，發展前景其實不大，而可以直接用於行業發展的人工智慧才有真正的發展前景。我喜歡哪些可以將技術應用在已有行業的人工智慧初創公司，而不是那些研發一般性技術供其它公司使用的企業。

就我個人來說，如果你的初創公司有可以幫助自閉症兒童快速學習的人工智慧技術，那我就會有非常強烈的興趣。而如果你的公司有可以讓機器學習更加準確的技術，那就不是很好了。

2015年，創新工場CEO李開復獲得卡內基梅隆大學授予榮譽博士畢業前，與安德魯·摩爾（右一）的合影。

新浪科技： 2015年卡內基梅隆大學有將近50名科學家陸續被Uber挖走。而人工智慧領域的頂尖專家加入企業也是目前的趨勢。您對當前人工智慧教育環境是否有擔憂？

AM：從2015年1月起，我們新錄用了26名教職員工，而只有4個人離開。目前匹茲堡（卡內基梅隆大學所在地）也已經成為了全世界的自動駕駛技術中心。科研專家加入企業看似是個問題，但這反而對大學和匹茲堡都有利。

實際上，我在擔任卡內基梅隆大學計算機科學學院院長之前，在谷歌從事機器學習系統方面的工作。雖然我喜歡谷歌的哦概念股走，但我還是決定重新回到卡內基梅隆大學，因為當今世界上最頂尖大學所從事的研究共奏是極其重要的，也將決定21世紀的發展情況。而我所需要解決的一個問題就是，在一個人工智慧已經實現商業化的世界里，大學可以扮演什麼角色。

比如卡內基梅隆在10-15年前就已經開發出了自動駕駛技術，那麼下一步應該做什麼？我們不想一直關注業界已經在做的事情，而是可以有哪些前瞻性的研究。

對於想離開大學的教職工，我不是勸留，而是鼓勵他們這樣做。其實開發冷撲大師的Toumas Sandholm就已經建立了一家公司，叫Strategic Machine Inc.。這家公司就是從卡內基梅隆大學拆分出來的。大學會將人工智慧應用在撲克上的技術授權給公司，公司再專註與不完整信息博弈的研發和商業應用。

對於新錄用的人，我其實會建議他們在這裡做4-5年的研究，加入業界工作上3年，然後再回來做5年研究，這才是應該有的職業生涯，二者都不耽誤。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點

專訪德撲AI背後專家:人機戰不靠深度學習 靠「談判」

專訪德撲AI背後專家:人機戰不靠深度學習靠「談判」