search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

商湯科技CEO徐立:人工智慧突破與行業未來

導語:我認為人工智慧的階段,它是一種階段跳躍式突變的,每一個階段的變化,需要基礎的演算法突破和核心技術的研究,原創的技術,才是推動整個人工智慧變化的核心。

【艾瑞網 直播】2017年6月6日-7日,由艾瑞集團主辦的2017艾瑞(北京)高峰會議在北京國貿三期大酒店舉辦。

本屆艾瑞峰會匯聚互聯網核心力量,以「創想·聚能」為主題點燃行業精英釋放互聯網原力,共同探討互聯網經濟與社會變革。作為互聯網行業極具影響力的品牌峰會,在這裡除了感受行業尖端腦力的碰撞,也能隨著艾瑞集團15年成長的經歷,窺探理解互聯網行業的脈搏。

以下是商湯科技CEO徐立發表題為「人工智慧突破與行業未來」的演講實錄。

商湯科技CEO徐立

徐立:大家好!非常榮幸收到楊總的邀請,來到艾瑞講一講,我們商湯對人工智慧,對行業的一些看法。

我覺得艾瑞這個活動,我們特別喜歡,艾就是喜愛,瑞就是愛研究,作為研究人員應該都來,我們公司有超過一百多名博士,單方面,是人工智慧密度最高的企業,博士密度最高的企業。

這一頁一定要替公司打一個廣告,介紹一下公司到底做什麼。商湯是人工智慧平台性的公司,我們想要做的是利用現代人工智慧最火熱的深度學習,打造深度學習平台,我們把深度學習的平台應用到各類垂直的技術應用突破上,把商湯形容為業內的公司,我們在內功強了之後,應用十八般兵器,和我們打通結合,進行迭代。

接下來講人工智慧的突破,很多人拿這張圖問我,人工智慧經歷了三波浪潮,經歷了不同時代,這一波人工智慧興起的時候,商湯有什麼看法。看了半天,看不懂。首先,這個圖,所有的起點,應該倒著看,這一波人工智慧興起,講的是深度學習,深度職能顛覆。倒推過去有三個高峰,每個高峰都和這一波人工智慧興起息息相關,我仔細想的時候,一九五幾年只有幾個人提人工智慧,拋開前兩次浪潮不說,第三次浪潮,我出生了,我03、04年畢業的時候,行業做人工智慧行業的這些人,出來都找不到工作,都不敢說自己是學人工智慧的,怎麼那個時候是說浪潮開始了呢?我們也很疑惑。仔細想一下,人工智慧細分行業太多了,第二個最關鍵的是,人工智慧的突破,是一個突變,不是漸變的模式。

講一下人工智慧的細分行業,大家知道的非常多,這波人工智慧關鍵的鑰匙,我們稱中間大的大腦叫深度學習,把傳統的人手工智能設計的智能,漸漸轉化成純數據的智能,它給了大家超越極限的可能性,我們在語音識別、機器視覺、自然語言理解上擁有非常強大的空間和落地的點,商湯做的是機器視覺,我比較喜歡這個詞,我們是用機器實現我們的願景,我們作為十幾年的公司,突然在這一兩年,你轉做人工智慧,我們有點不太適應,不過漸漸就會習慣了。關鍵核心是中間的演算法能力,其實是打開了大家的思想空間,可以做下棋,甚至無人駕駛,包括還可以作為聯考,自動聯考的機器人,其實是一種幫助大家能夠打開對未來想象的核心工具。

人工智慧的細分領域,這是Google。他把各種書上面的關鍵字都輸入進去,人工智慧每個細分行業,發展全都不一樣,在08年,計算機視覺基本上是無人問津的行業,人工智慧都不想說自己是做計算機視覺的,做計算機視覺的,都不想說自己做人工智慧的,因為都找不到工作。人工智慧低谷的時候,出現兩個高峰,專家系統,機器人,所以剛才第一張圖,有點牽強。講到這一波信息,到底發生了什麼事情,主要是深度學習的突破,我們做一個這樣的檢索,Google搜索深度學習的關鍵詞,深度學習這個詞,從06年就開始有了,之前叫神經網路,那個詞搜索更低,大部分的時間,即使到2012年都是平的,說明什麼呢?說明跟我們的印象是一樣的,人工智慧就是一夜變火了,那一夜到底發生了什麼事情?大家公認的事情,就是深度學習之父,就是頭腦當中識別物體。第二個使用了GPU實現這樣一個視覺識別。這就是兩個非常大的含義,第一個,視覺,我們人眼睛所看到的東西,就叫視覺內容,70%以上的是互聯網內容,第二個用GPU是顛覆性的變化,我們做大數據分析,背後需要非常強大的運算能力,但是使用CPU,使得創業公司,小公司,有機會在很短時間內,用同樣廉價的計算能力,獲得大公司集群獲得的能力,舉個例子,我們做人臉識別,最早在深圳的超算上,花28天進行迭代,在六塊GPU卡上用6個小時,這就是GPU的威力,帶給大眾的人工智慧的普及性。

在這裡面起到什麼作用?我也很好奇,做了同樣的搜索。得到這樣的答案。很有意思的一張圖,人工智慧進入五年來,以及關於深度學習近五年來,在全球搜索的熱度,可以看到一枝獨秀,遠超美國,加拿大、歐洲。大家有沒有發現,有什麼奇怪的地方?Google在是被禁掉的,這也就是說,近五年來,人民通過反欺詐能力,翻到了國外,搜索深度學習,干倒了美國人。這是多大的熱情。我也想說,所以說人工智慧在有新的機會,它擁有新的應用場景,比如說我們做人臉檢測,還有全體分析,我擺一個攝像頭,很輕易獲得應用場景數據。所以人工智慧的熱,真的不是假的。美國去年白宮出了一個報告,中美人工智慧的發現,已經超越美國,這只是開始,未來在這個當中,會起到越來越大的作用。

我認為人工智慧的階段,它是一種階段跳躍式突變的,第一個階段,其實是很傳統的,我列出視覺行業裡面,最著名的文章,人臉檢測,第一個階段稱為技不如人的階段,那個階段,所有智能基本上通過專家的知識轉到系統當中,人工指導的智能,比如說以前做人臉檢測,有各種各樣的模板,眼睛下面那條要黑一些,鼻子比周圍白一些,並且是對稱,有了這樣的模板之後,可以做人臉檢測,可以想到,這些知識和設計,最後決定檢測的結果,這是人可以知道的。從哲學商來說,人知道機器,機器一定會超過人。現在人工智慧,主要是一種生產力的工具,作為生產力的工具,沒有超越人,就好像當年的蒸汽機,怎麼樣會有很大的行業應用?所以在那個階段,做機器視覺的時候,都說做得不好。

現在我們進入第二個階段,叫做超越大眾階段,我們近年來在2013年、2014年的時候,被我們諸多領域驗證了,機器在垂直領域裡面,可以做到超越人的水平,普通人的水平。包括在人臉識別。商湯的團隊,在人臉識別領域,第一個超越人。包括各個細分領域。為什麼這裡說是超越大眾,超越普通人呢?是因為,我們做人工智慧,必須要把人的知識傳達給機器,那就需要標註數據傳達機器的過程。在超越普通人的過程當中,因為大眾或者普通人的知識,其實是比較容易獲得的,比如說我們人臉的檢測,眼耳口鼻,在座各位,很容易指出眼耳口鼻在哪裡,也不需要上一個博士才能獲得。

再比如說,我們提供視頻鑒黃的服務,我們當時深圳HRO就跑到我們公司來,就跟我說,說徐總,發現一個事兒,我們深圳有一個團隊,天天躲在一個小房間里看黃片,我說不是,我們做一個視頻鑒黃的分析,我們後來在辦公室提了一個牌子,禁止自娛自樂。從馬路上拉一些人過來,在小房間里就能幹,這是普通人大眾的數據,大眾的知識很容易獲得。但只是在現在這個階段,但是所謂的大眾知識獲得,只能通過降成本這件事情,更核心的是超越專家,專家稀缺不可獲得。

比如說艾瑞的霍總也講醫療,一些大的方向,醫療是特別需要專家的,醫生老專家特別厲害,我知道有一些醫生,通過一張片子,可以很輕易的判斷,你是骨科的什麼問題,甚至肺癌的早期都能看到,這些專家,都要掛專家號,平時找不到。如果說需要把這位專家的知識,傳達給電腦,需要多久呢?我們一般需要百萬級別的數據,算了一下,大概七八百年的時間,他就可以把這個數據了解了。

這是不可能發生的階段。所以在這裡每一個階段的變化,需要核心演算法的突破,我把AlphaGo放在第三階段的中間,為什麼?是因為大家說AlphaGo超過世界上最好的專家,但是AlphaGo是通過讀取人類記錄的50萬個棋譜,把所有人的經驗記錄下來,它基於這個往前走的。但是最近又把它往右移了一下,因為現在的AlphaGo,通過演算法的演進可以更少地依賴於深的知識,但是還是依賴,但是在未來的話,我相信這一部分,第二往第三階段的跳躍,還是靠核心演算法的突破。我們其實在第一和第二階段之間,大部分人都沒有超過普通人,試想超過普通人,化學效應會非常大,真正的還是基礎核心的研究,原創的技術才是推動整個人工智慧變化的核心。

這是前面講的演算法的突破。後面講講對行業的看法,我們認為,所謂的基礎的演算法突破和核心技術的研究,其實很關鍵的一點,是要在應用場景循環打通的,商湯在做兩件事情,第一是在應用當中定義問題,第二超越人類的水平,我舉一個例子,一直講說人臉識別,這是我們開發的人臉識別系統,比較傳統和高清的,看得比較乾淨的人臉識別系統。現實當中,我們面臨是這樣一些真實場景,這是我們一些真實的案例,你可以看到,這邊左右兩個人,都是同一個人,你發現年齡跨度特別大,髮型完全不一樣,第三個到底是不是同一個人。都會非常懷疑。右邊這張也是傳統的,是店面的安裝攝像頭捕獲的畫面,解析度這麼低,在這個時候,我們用實際應用場景定義來解決,我們畫這樣一張圖,圖片很小,分辨力很低。

做人臉識別怎麼辦?美國FBI給了一個例子。這是一部電影,《諜影重重》。FBI在裡面需要找到自己想要的人,通過電腦找到了目標對象。放大一看,這麼不清楚。但是FBI是有魔法的,說變,就變成這樣子了。好厲害!這是左邊這張圖,說一聲變,就變成右邊的高清了,現實當中可行嗎?我們也懷疑,所以剛才的案例,同樣的場景,大家想美國是不是有這個技術了?沒有,我們也試一下,把左邊的這張圖變成右邊的結果,這是我們的目標,現實情況呢?現實情況的演算法,只能是這個樣子。是清楚了,大家看得很清楚,但是如果說你要用左邊這張照片,通緝犯的照片,來抓右邊的照片,這有一種你在逗我的感覺。這裡面的核心還是說核心演算法的突破。它的應用廣泛嗎?很有意思。我們發表了演算法,發表了這個成果之後,日本有一個網站,馬上用了我們的成果,這個網站很有意思。原來這個waifu,就是太太的意思。日本人的太太就是漫畫,他用網站做的事情,就是把漫畫放大兩倍,看到原始的細節。

我們來看一下這個事情研究是不是重要,在這裡面核心的演算法突破,Twitter在16年、17年都有這樣相關的任務,因為他們都是在應用當中找到這個問題。他們的圖像存儲,壓縮傳輸都是非常重要的,需要這樣一個過程。我們很早就在應用場景當中時機的需求和數據驅動的方法,從14年到17年,把這個鏈條完整地傳輸出來。我們可以達到什麼樣的結果。我們來看看我們的結果。比原來漂亮一些,這個結果恢復出高清的,關鍵是用它識別人,我們來看看真實的場景,這就是剛才的真實場景,小圖片。我們可以用我們的方法恢復出細節。小圖片恢復出細節。在真正的實戰當中也起到非常大的作用。這是我們的一個同事,這是在深圳實時對比,他們已經在公安完全上線了,這是後來我一看,這是華為的羅總,非常不好意思。跟我們很好的關係,跑去深圳的市局,一搜搜出來了,一看年齡差別很大。還有另外一個同事,可以看到模糊的,不清晰的,甚至有問題的。所以才會有人說,商湯的演算法,一騎決塵,因為它真的是基於傳統的鏈條。我們每個人的生活都被改變了。我們在安防裡面,會記行蹤甚至是車,都在攝像頭裡面被體現了,大家都不知道而已。

智能認證,比如說手機的登錄,或者ATM取過錢,用過人臉,現在在深圳都有這樣的應用,包括用手機做支付的時候,刷臉,現在聯考系統,也已經用人臉來做驗證,在試點當中,忘了帶准考證,也可以考試。讓考生不那麼緊張。

這是稍微遠一點間接的使用。以下人工智慧進入社交APP領域比較多,現在蘋果,小米、華為的手機相冊,裡面都有自動的人臉分類。再比如說,大家在朋友圈傳過貓耳朵、兔耳朵,也是人工智慧具體的體現,我們是背後演算法平台的提供者。再比如微博的分析。

最後講一下商湯在人工智慧行業,我們希望通過商湯的合作夥伴,一起來定義問題,第二把這個問題做到超越準確率。

講一講我們商湯的願景,我們還是希望堅持原創,讓AI引領人類進步。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦