search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

CV+圓桌對話:演算法不是唯一考量,創業公司的商業閉環才是最大難點 | CCF-GAIR 2017

7 月 9 日下午,由計算機學會(CCF)主辦,雷鋒網與香港中文大學(深圳)承辦的第二屆CCF-GAIR全球人工智慧與機器人峰會,進行到最後一天,CV+專場的圓桌論壇作為本次大會的最後一個議程順利進行。圓桌討論的主題是,計算機視覺滲透生活。本次圓桌由微軟亞洲研究院資深研究員梅濤博士擔任主持人,他幽默但犀利的主持風格博得現場陣陣掌聲。

參與本次圓桌的五位圓桌嘉賓包括:中科院計算所研究員、中科視拓董事長兼 CTO 山世光、閱面科技 CEO 趙京雷、圖麟科技 CEO 魏京京、瑞為智能 CEO 詹東暉以及臻識科技 CEO 任鵬。

雖然大會已經接近尾聲,但現場依然座無虛席,觀眾們也幸運地看到了六位大牛時而輕鬆愉快、時而嚴肅認真的討論。

雷鋒網整理了本次圓桌的討論全文。

梅濤:今天我們圓桌的主題是「計算機視覺滲透生活」。為什麼今天選擇這個主題?因為我們覺得計算機視覺已經滲透到我們生活無處不在的地方,滲透這個詞英文是「permeate」。計算機視覺已經在改變我們生活的方方面面,我們有必要探討一下計算機視覺到底在我們生活中能夠產生什麼樣的影響以及怎麼落地。

今天我們會邀請到五位嘉賓,剛才我用好奇心給每個人起了一個外號,如果不當請原諒。因為做科研,總是喜歡做一些很創新的事情。

第一個嘉賓,剛才山老師說公司最小,所以請他第一個上台,給山老師起名字叫「X man」,因為山老師剛才講了很多「X」(雷鋒網 AI 科技評論按:山世光博士的演講題目為《X 數據驅動的 Seeta 平台與技術》)。有請山老師。第二位嘉賓我起了個名字叫「憂鬱的男子」,歡迎趙京雷趙總。趙總是畢業於上海交通大學的人工智慧博士,現在是閱面科技的 CEO。第三位嘉賓我起的名字叫「Cool Man」,有請圖麟科技 CEO 魏京京,他是我的師弟。第四位嘉賓我給他起的名字叫「風一樣的男子」,因為他穿著黑衣服,像個黑衣人一樣,他就是瑞為智能的 CEO 詹東暉。詹東暉博士是瑞為智能的創始人兼總經理,十一年在華為的經歷,創立了瑞為智能。最後一位嘉賓我們叫「Cooler Man」,因為他看起來比我師弟更酷,有請臻識科技的 CEO 任鵬。(現場笑聲+掌聲)

今天有幾個話題給各位嘉賓準備,在座來聽課的各位老師和朋友也可以提出你們的問題,通過雷鋒網的同事給我傳達一下。

第一個話題比較簡單一點,大家覺得計算機視覺對我們生活產生了什麼影響?大家可以結合自己的生活講一講你們的體會,我們從最小的公司開始吧,山總。(現場笑聲)

山世光:我最近經常在演講的時候問大家一個問題,你今年刷了幾次臉?我相信在今年也許你會刷三五次,明年搞不好得三十到五十次了。為什麼這麼說呢?因為人臉識別,就像剛才說的,在過去幾年時間裡面是計算機視覺裡面最快落地的一個技術。我自己做人臉識別,我就不說「之一」了,這個技術確實在不斷滲透到我們日常生活里,大家可以看到出行方面,比如說坐高鐵、飛機,機場需要刷身份證,驗證你這個技術是不是能應用。包括接下來幾年,我們有大量公司採用人臉識別的技術做員工的考勤和門禁。這一代考勤門禁跟上一代不一樣,三四年前我們家旁邊的門禁考勤都是人過去,還是要看著屏幕做考勤,未來將會是無感的考勤,我相信人臉識別會越來越多的滲透到日常生活中去。人臉識別就像門和鎖的關係一樣,你需要進入到某一種狀態,有這個許可權就可以驗證你是你,這是幾乎無處不在的場景。我就說一下人臉識別,後面還有很多空間可以說。

梅濤:謝謝山老師,山老師認為人臉有很多因素。

趙京雷:「憂鬱的男子」這個名字特別貼切,因為我這一年馬上要開始駕照年審了,我已經被抓拍三次了,馬上要開始去學習了。

對我而言,計算機視覺對我而言不能說是好的改變,但是對車牌的識別(很重要),每天我們開進去停車場,這種技術很成熟,已經潛移默化了,我們已經意識不到這種技術的存在了,包括臻識科技也在做這種技術。我們生活中類似車牌識別的技術大量存在了。跟車牌識別相關的 OCR 技術,包括手機裡面各種各樣的貼圖、美顏。說到美顏,好像在座的女生不是很多,只要是女生,我覺得這已經是必備的。很多技術我們每天意識不到它的存在,我覺得這更是標準的這些技術的成熟。

反過來,我們思考一個問題,比如說山老師剛才談到的人臉識別,包括馬雲,包括很多公司,每天都在講刷臉,為什麼把它叫做一種技術呢?從這個角度考慮,我認為這個技術反而是不成熟的。過幾年以後,我們再也不講刷臉,每天很正常,我上街買一個東西,不需要站在那裡一刷,付一下款就可以了,這個時候技術會真正走向成熟。

梅濤:謝謝趙總,人工智慧帶來很多便利,但是需要人們更加的自律,希望趙總以後不要再憂鬱了。接下來請魏總談一談計算機視覺給你生活帶來什麼改變。

魏京京:人工智慧給我帶來很多借鑒,我們平常感受到人工智慧的點非常少,比如說我們用 FaceU 這種產品,還是比較簡單化的產品。其實 2C 和 2B 我們看了很多,但是真正 2C 落地非常難,大部分公司都在做 2B 的業務,2B 是做我們正在做我們用到的東西。如果說視覺改變生活,現在這個階段是非常隱藏的,你是看不到的,在每一個商品的背後是大量的服務和技術在裡面,只是你感覺不到。後續的發展會從後端延展到前端,我們用的東西會慢慢感覺到有視覺的東西在裡面,這個時間還很長。現在 2B 的業務我們做不過來,還有很多需要挖掘,2B 的爆發點還在後面,我非常看好後續三五年視覺在我們生活中顯現出來,大的關鍵的應用機會非常多,我們創業公司先做 2B 的事情,慢慢技術、場景、用戶行為習慣和付費習慣成熟之後慢慢會到前端。

梅濤:魏總的意思是你認為人工智慧先從 2B 業務開始,然後慢慢滲透到生活。

魏京京:對,先從 2B 滲透到產品,慢慢滲透到前端,包括 2C 的產品和應用會越來越多,這是創業公司和產業發展的大的機會。

梅濤:下面請詹總講一下人工智慧的變化。

詹東暉:我覺得如果從人工智慧對生活的影響,最直觀的還是臻識科技他們做的車牌識別,以後每次進出停車場不用取卡。我們四位都做人臉識別,大家感受很多的還是刷卡,未來很多機場會增加人臉識別的登機,包括廈門碼頭,你去鼓浪嶼必須做人臉識別,包括未來做長途汽車,這些領域都會通過人臉識別技術的引入,讓整個生活變得更安全。

開始我們也做了剛才魏總講的 2B 的場景,這兩年我們開始在家電領域引入人工智慧的技術,比如我們跟美的合作開發了智能空調的產品,現在已經開始在賣場做銷售。你可以通過手勢、語音可以讓空調更智能的感知人的喜好,這是潛移默化的對生活的影響。我們瑞為智能做的更重的是 AI+零售的應用,現在在很多門店,特別是在北上廣深很多門店逛街的時候,我們攝像頭已經在分析你的喜好,包括分眾的媒體已經有我們的一些攝像頭,這些已經在間接的潛移默化的改變我們的生活方式。這是我做的一點補充。

梅濤:謝謝詹總,基本上你們會讓我們購物非常方便,也方便了商家。最後是任總,談一談你的看法。

任鵬:剛才兩位老總還介紹了我們公司。我們做的確實對大家當前的出行帶來很多方便,現在停車場的進出就已經很方便了。其實還有一些很簡單的,大家已經感覺不到的其實對生活改變更大。我想問大家每天會掃幾次碼?這是非常簡單的計算機視覺技術的應用,裡面的關鍵在於它的準確度,如果人臉識別真的像山老師講的那樣,準確度達到百萬分之一的時候,對大家的改變就完全不一樣了。一個技術要改變生活,還是在於這個技術的成熟度。如果不是走這個方向,可能會在娛樂方面,比如說在遊戲方面改變生活。我們走的是工業化的路線,比如說安防的應用、工業自動化的應用,對演算法的準確度要求是非常高的。現在隨著技術的發展,我相信我們技術的改變對大家生活的影響,可能不知不覺中大家的習慣就改變了,還不知道這是因為計算機視覺的改變。

梅濤:謝謝任總,謝謝五位嘉賓的講解。我自己感覺剛才問的問題比較簡單,我是比較喜歡提一些難的問題的,我對剛才問題的解答不夠滿意,因為他們在變相做廣告(現場笑),所以我接下來的問題稍微難一點。問題沒有變,我想問大家,你覺得計算機視覺能夠改變生活的哪個方面呢?但是得是除了你們業務以外的方面。把這個問題先提給詹總。

詹東暉:您的意思是在我們業務範圍之外。

梅濤:對,這才是真心話。

詹東暉:我覺得人工智慧對生活的影響,這個趨勢肯定是必然的,只不過我們看它是在五年之內、十年之內能夠多深地改變我們的生活。我可能偏悲觀一些,在我們能看到的眼前三到五年時間,我覺得還不會給我們帶來很大的變化,比如說機器人,雖然現在機器人很火,但之前看起來很傻萌的機器人有沒有用處?好像沒有什麼用處。

梅濤:大家可以看到,我第二個問題把他真心話問出來了。(笑聲+掌聲)

詹東暉:對,我認為還需要蠻長的一條路,在技術上面做更多突破和革新。剛才任總說到,對人臉識別來講,客觀來講,我們不吹牛的話,它還是能夠達到非常高的精準度,能不能把人臉識別作為唯一的取款方式,未來三到五年是不可能的。我們講陽光大道的同時,其實還是有很多挑戰存在的。

梅濤:這一點我深為贊同,謝謝詹總。誰自告奮勇第二個來講一講你的真心話。

趙京雷:這個問題非常有挑戰。對大部分視覺公司來說是有需求,然後賣技術。我覺得這是我們要思考的問題,我們成立一個公司,80% 是不做得,10% 或者 20% 要專註做這個才可以,首先要看我們專註的點是什麼,我們在視覺上面,但是不代表我們不具備其他的能力,比如說 FDDB、LFW 技術我們公司目前排第一,我們也可以解決很多安防問題、金融問題等等,和人相關的東西我們都可以解決,但是有所為、有所不為,我們目前主要關注怎麼思考山老師講的刷臉。

刷臉講了這麼多年,在消費級範圍內怎麼能夠成為現實,有沒有具備創新性的產品出來,所以我們更多是基於對這個核心技術自己去做一些創新性的產品,希望能夠做一些能夠改變行業的產品,而不是做大家都能解決了的問題,解決不了的問題是大家沒有好思路,我們希望從自己意願而言尋找這些思路和尋找方法,不是喊兩三年,大家針對這個問題一直停留在這個狀態,這是我們去做的。反過來,某種意義上講,如果大部分人都能解決的問題我們不太會去做。如果問題很強,比如說在識別裡面,怎麼能夠在未來普及,怎麼樣成為人人可用的技術,不只是掌握在政府、只是掌握在少數人手裡的技術,我們希望更多的做這樣一些事情。

梅濤:謝謝。魏總,你有什麼高見?

魏京京:剛才都說了一些虛話,現在說實在話。說心裡話,從一開始我們做這個行業,從三年前到現在為止,我們對人工智慧和這項技術的理解並沒有像外面媒體宣傳的那麼酷、那麼炫、那麼反人類,它只是對軟體技術的爆發而已,對我們生活或者行業的改變,我覺得是潤物細無聲的改變。上一個潮流是在講互聯網和移動互聯網,互聯網和移動互聯網的特點是爆發力度非常強,爆發出來的時間點非常短,比如說共享腳踏車等等互聯網的產品。在人工智慧這個產品,你希望在一年兩年或者三年五年有更新換代變革的東西不太可能,不管在產業過程還是在我們生活過程中,它只是一個輔助手段,只不過把我們原來認為比較難被智能化的東西逐步開始智能化,但是這個過程也是非常緩慢或者非常逐步的。

我們給客戶做產品,一開始不是把所有東西都顛覆掉,只是在某一個環節能夠幫你節省人力、金錢或者時間效率,說實在話,這個東西沒有那麼高大上,也沒有那麼反人類,只是這個時間點出來一個很好的技術,給它插上一個翅膀,在每個行業慢慢顯現出它的價值。所以,這個行業的周期應該比互聯網和移動互聯網長非常長的時間,我看好十年、二十年之後可以在技術革新和產業進步方面發揮更大的作用。

梅濤:魏總說了很多真心話,至少是有希望的。任總呢?

任鵬:我講一個改變生活的場景,我們也想做,但是技術還達不到。比如今天這個會場,如果安防領域的技術能識別出在場的每一位是誰,這會兒在講什麼話,我覺得這個場景會對大家的生活有非常大的改變。

梅濤:你想幹嘛?(現場笑)

任鵬:我們想做,但是這個比較有難度、比較有挑戰,受限於當前的技術。

梅濤:比如你知道各位的知識文化水平、受眾面,可能今天講得會不一樣。

任鵬:簡單一點,有點像上帝。做技術的可能會有這樣的想法和追求,但是實際上他對生活的改變可能是負面的,沒有隱私了,也有可能有的人的工作會失去,但是這種發展是擋不住的。

梅濤:謝謝任總,最後有請我們最小的公司的山總。(現場笑)

山世光:我想跳出來計算機視覺講整個 AI 領域。這次大家注意到搜狗同傳這件事情,還是蠻有意思的,中文不太好,但是對英文,包括同傳比較好,包括今天聽醫療那邊講的,不用聽英語,看中文基本上能理解是什麼意思。像這樣一個技術不是說多麼成熟,但是如果不去用,更加不能走向我們的日常生活。對計算機視覺來說,需要比語音識別還要更晚一點,這是一個必然的現象,因為語音識別的好處是識別完以後變成文本,變成文本就有語義,直接可以跟互聯網掛鉤,這對計算機視覺來說,大多數場景裡面我們看到圖像裡面精確的語義比較少,我們希望把圖像裡面儘可能多的語義儘可能精確地提取出來。當儘可能多的語義被提取出來以後,後面是有很多空間可以做的,但是相比語音識別我覺得會晚蠻久。如果不是人臉識別,還有很多,計算機視覺一定是潤物細無聲的作用。

如果非要說計算機視覺,最廣泛的應用就是在滑鼠領域。大家知道光學滑鼠的原理,就知道光學滑鼠在移動過程中是通過圖像匹配做移動位置的檢測的,大家天天都在用計算機視覺的產品,但是大家不覺得它是計算機視覺的產品。很多時候計算機視覺產品往往是錦上添花,潤物細無聲,你沒有感覺的時候讓你體會到技術給你帶來的好處。在醫療方面我非常看好,我覺得未來自動這件事情很快會超過平均以上醫生的水平,對醫療的改變會非常大,當然政策上的原因,如果政策能夠突破,這是非常大的改變。

梅濤:剛才問這個問題我是希望大家能夠發散思維想一想,也許十年、二十年後大家可以去那個方向創業。

接下來的問題,請允許我作為主持人再問最後一個問題,待會兒大家可以準備一些非常難的問題。下一個問題很簡單,我想問大家,因為大家創業好幾年,踩過很多坑,我們在微軟做產品、做研發的時候也遇到好多坑,我想問大家,你覺得人工智慧技術在落地過程中最大的難點是什麼?希望大家簡潔明了的告訴我們你遇到的難點是什麼,你覺得這個難點應該朝哪個方向解決?

任鵬:我覺得最大的難點是閉環。這個閉環是指什麼呢?市場的需求和當前的技術能達到的水平的閉環。做這個產品的時候,作為一個創業公司,你能把握的影響產業鏈的閉環,比如說取得數據,以數據來驅動,當前產品的結果和客戶市場的需求還有差距,你反過來怎麼迭代?所以這個閉環是非常關鍵的。

舉個例子,安防行業,08 年我們剛剛開始創業的時候,客戶提了這樣一個需求,你們的演算法能不能把場景裡面的人、車都識別出來?過了九年,當前的技術是可以解決了,但是要批量化成本很高,客戶會不接受這個東西,他想的是,你們能不能把這個東西識別出來,又很便宜。所以,這個閉環是很難的,做產品的時候就有很多需要取捨和平衡的東西,要去平衡你的功能、性能,滿足客戶的指標、期望,最後在產品設計和成本相關的這些方面,其實一個核心就是閉環。

梅濤:任總認為閉環是一個難點。詹總呢?

詹東暉:我也同意任總的說法,閉環是一個難點,對商業場景來說,對人工智慧的需求是存在的,但是為什麼這麼多年沒有什麼應用?最根本的原因是技術,這兩年比較火,因為深度學習的引入讓技術的性能上達到一個跳躍,我們發現很多場景似乎具備了可應用的基礎,這距離人工智慧要達到的目標是有差距的,但是不意味著不可用。如何讓這個技術和用戶需求達到一個平衡,這是一個難點。

另外,剛才提到深度學習,深度學習是一個很消耗處理資源的技術,很多時候一個問題是如何在一種低成本、高性價比的方案裡面去實現。你可能做出一個很牛的識別相機,但是成本要 2 萬塊錢,這個相機可能就基本上沒有辦法銷售和商用。

舉個例子,我們在做 AI 放到零售的時候,做了快四年才推出第一代產品。從演算法上來看,我們並沒有做太大的革新,這三四年都在做它的落地。從最開始很複雜的系統,要前端相機、後端伺服器,那時候成本要大幾千塊錢、一兩萬塊錢,做到現在可以很低的成本,一兩個很小的攝像頭,可以完全不依賴網路和雲端,可以做複雜的智能學習的演算法的實現,我們花了四年時間。因為這四年時間的投入,達到這樣一個落地化的產品,才使它具備開始規模的在商業應用的情況。我覺得這裡面很大的挑戰在於,演算法本身已經不是一個最主要的維度了,而是看怎麼做落地化。

梅濤:關於落地化我自己感觸很深,因為我經常遇到客戶,客戶經常提出無理的要求,客戶說你能不能識別人臉做到 5 個 9、6 個 9?我說我可以識別出來黃曉明,但是識別不出來梅濤,這是兩個不一樣的場景。

魏京京:觀點基本類似,我們創業過程中最大的一個難點是怎麼從飄在天上落到地下,因為視覺這個領域基本上是很高的技術壁壘或者帶著技術光環創業,否則做不了這個事情。通常是以我為主,客戶圍繞我來轉,我們也犯了這個錯誤,我們產品設計的時候以我為主,這是技術背景的公司很容易犯的問題。

我們慢慢從飄在天上到接受現實落到地下,跟之前兩位的理解是差不多的意思,最關鍵的不是你有什麼技術,而是你把已有的技術跟他的痛點結合,這個問題不是技術的問題,基本上就是商業問題。你要做商業閉環,同時要跟已有的環節有合適的商業產品的設計,這個需要付出的努力不是做技術的來做的,而是你要接地氣,圍著客戶做討論、設計和服務,讓他慢慢接受你,這是很痛苦的,也是我們做技術創業需要轉換的地方。我原來也做過投資,看過很多以技術為背景的創業公司,這是很容易犯的一個問題。

梅濤:謝謝魏總,魏總說出很重要的一點,要服務客戶,要理解他的需求,要整天圍著客戶轉。(現場笑)

趙京雷:非常同意前面幾位嘉賓的觀點,這確實反映了技術創業遇到的比較大的難點或者痛點。從我們自身而言也是這樣,可以歸納為兩點:第一點,怎麼樣管理客戶的期望,不一定是用戶的期望,因為大部分是 2B 的。可能受很多媒體或者各方面的宣傳,如果不是做技術這個行業的,總是對 AI 能做的事期望太高了,不管是普通的小機器人或者對視覺技術期望太高,經常有各種各樣的公司找過來說,我有這樣的需求,你能不能做。

第二點,計算機視覺不是萬能的,比如說我們一般說的視覺是 RGB,計算機視覺這兩年進步很大,在 RGB 普通鏡頭下,光線、角度各方面都有了比較大的進步,但是現在的技術發展的情況還不是所有問題都能解決。跟客戶解決的問題可能依賴計算平台,依賴整個體系的聯合優化,比如說有很多場景的客戶找到我們說,能不能幫我們做一件事,我們會問他,這個事情晚上要不要做?晚上要做。他是拿普通攝像頭,補光的時候,這是消費級的,你又不能拿燈去補光,這種情況怎麼去管理,和客戶一起去梳理行業碰到的這樣一些需求,然後把它抽象出來,怎麼樣用最好的晶元、最好的後台系統結合演算法一起去做,其實演算法一定不是孤立的。

梅濤:謝謝趙總,其實我也很贊同,因為我發現用戶需求和期望有兩種,一種是用戶沒有期望到你演算法能做到這一步,另外是用戶覺得這麼低的要求演算法做不到,其實用戶需要引導。

山世光:其實我特別不想同意他們幾位的觀點,但是在是沒有辦法不同意。(現場笑)我就不重複了,但是我的觀點是,最大的障礙還是技術不完美。我們所謂的技術完美,當然我們希望「快、准、穩」。快是隨便找一個很爛的晶元就可以做;準是什麼情況下都能工作;穩是不會出現差錯,這樣落地和閉環就不會出現難題了,但是我們現在真的做不到。比如剛才說的萬分之一,很多時候是達不到的,比如變換場景,晚上你非要用普通的攝像頭就是做不到,沒有辦法。我覺得真的還是技術上不完美,這也是這個領域並沒有到非常非常完美的馬上可以四處用的階段,在這個階段最難的是怎麼去找到客戶的需求和技術的邊界能夠結合的應用,再配合上其他的一些條件,能夠滿足用戶的需求。剛才幾位說得都對,技術不完美還是一個很大的障礙。

梅濤:其實我覺得不完美有時候也是一種完美,正因為不完美所以我們有很多機會。

山世光:對,上帝也不完美。

梅濤:謝謝大家。接下來把時間留給在座到場的聽眾,不知道有沒有非常難的問題?

聽眾:我想問一個很具體的問題,關於圖像識別領域的競爭差異化的問題。現在有一種說法,在人臉識別、醫療讀圖領域,行業裡面這兩個領域主要的公司用的技術都非常像,有人就說現在這些領域的發展變成不是拼技術,而是拼市場,去跑馬圈地,去融資和燒錢,不知道對這種情況台上各位老總怎麼看?

魏京京:你剛才提到圖像識別視覺差異化的問題。每家從圖像識別本身來說,從技術到落地中間的環節非常多,並不代表有圖像識別技術就既能在醫療領域做,又能在營銷領域做,又能在工業領域做,差的十萬八千里,這中間是顯現每家公司技術核心競爭力的。你要有技術落地,需要找數據源、找他的痛點,同時把商業閉環做好,不代表我直接說一個故事就有人給你錢,你就把這個事做成,中間的過程還是非常複雜的。我們做很多細分領域,每個細分領域少則半年,多則一年到一年半,中間需要打磨的東西非常多。

圖像識別雖然是有技術的通用性,但是到細分行業需要做的事情非常多,這個事情不僅僅是技術問題,技術只佔 1/10 甚至更少的環節,因為機器學習的原理邏輯帶來技術壁壘本身不是特別高,很多時候需要你把商業的東西完備的提供給客戶,這是商業要做的事情,也是我們公司創業要做的事情。我們不是做學術,是真正做一個人家願意買單的東西,要把這個價值鏈條梳理的更加清晰一點。

詹東暉:我簡單補充一下,我很同意,我的觀點是不會有所謂純粹的 AI 公司,AI 只是一個技術,對於我們在座的幾位來說也只是 AI 的創業者,每個人可能會選擇不同的落地行業、落地跑道。未來可能有人做安防,說誰是在安防領域做的最好的 AI 公司、誰是零售領域做的最好的 AI 公司。單純的計算機視覺技術的壁壘,對做得好的公司來講,這個壁壘越來越沒有差異化,做得好的就是看誰跑得更快,能夠更快讓技術和產品落到行業裡面去,更深的鋪到這個行業,構建一個更完整的行業壁壘,這可能會是一個更重要的地方。

趙京雷:我覺得這是一個蠻重要的問題,所以我補充兩句。其實大部分人都會問到這個問題,這家也在做、那家也在做,為什麼還要做這一塊?我覺得這個事情分兩個階段,一個階段是人工智慧技術底層還不是非常成熟,我們在做 AI 底層基礎設施鋪墊的階段,這個階段不像大家想象的那樣,比如說我們有開源的框架,把不同演算法寫上去,大家跑出來的東西是一樣的。如果是這樣,Facebook 和 Google 這樣的大公司就不用收購這種基礎性的公司了。像剛才魏總談到了,每一個單項技術成熟在不同領域、某一個點成熟,在這個結點需要至少一年半到兩年的時間,比如說一家公司從無到有的模型上做,第一個是在雲端能不能部署,在前端能不能部署,肯定需要一年半到兩年的優化過程。

我覺得在這個階段,人工智慧基礎設施快速落地的階段,不同公司的技術差異非常大,但是如果過了這個階段,我非常同意剛才談到的,這些技術不是絕對的壁壘,一年能算什麼呢?未來人工智慧的場合裡面一年可能就是一瞬間,所以這裡面技術肯定不是壁壘。那什麼是壁壘?剛才各位已經談到應用領域,我覺得主要就是產品。像移動互聯網早期那樣,基礎設施和運營商很早出現,最終是什麼樣的東西把不同的做這一塊的公司區分開來?一定是產品。比如說蘋果是爆品,iPhone 出來了。其實人工智慧現在缺少爆品。有一些公司,不管做什麼領域,能從這個領域裡面把自己的爆品打造出來,我覺得這就是未來 AI 公司本質的差異化所在的點。

梅濤:謝謝趙總。由於時間關係,可以再來一個問題。

聽眾:這個問題想請問一下山老師,剛才講到表情識別,識別表情到底幹什麼?我們是做行業應用的,在行業裡面的服務人員的微笑有一定的要求,微笑是比較簡單的事情,我的想法是通過這個表情我們在後台再進行一些深度的應用挖掘,比如說他的績效,企業可以根據這個做員工的關懷,這種勞動強度可能比較高,在後端進行進一步的挖掘,我想請教您的看法。

山世光:這是蠻好的問題。我覺得對 AI 感知人本身,除了認出他,還要了解他的意圖和情感,這一點是非常非常重要的。我們能夠想到有很多可以落地的應用,比如說風控,當然我不能做測謊,但是可以做情緒的感知。我可以做教育上的評估,比如說小孩在上學過程中的專註度、接受度等等這些方面,都是可以去做的。當然其實大家已經看到笑臉快門這些非常普遍的錦上添花的應用。另外一種是跟疾病、健康相關的,其實是泛情緒、泛情感的這部分,通過估計心率,不知道未來是不是存在這樣的可能性,可以測血糖、血壓,以前覺得技術上難度太大,現在看來其實都有可能,不是不能做。一旦當非接觸式的通過視頻方式可以做,我相信可以帶來非常非常多的應用。

梅濤:謝謝山老師。最後一個問題,我代表雷鋒網來提問,請各位嘉賓展望一下未來五年計算機視覺的發展方向,以及未來五年你覺得哪個方面可以更加深入我們的生活,哪些計算機視覺技術可以更加滲透我們的生活,給我們帶來更多便利?

任鵬:未來五年,我覺得感測器技術會變,深度的感測器可能會普及。多種數據源的融合,不只是視覺,多種數據源融合結合成產品解決問題,這種情況會越來越多。這是技術層面的。

當然,演算法也好,晶元、計算資源也好,肯定要符合摩爾定律,五年以後我覺得不會是瓶頸。因為十年前我做的是增強現實 AR,我覺得下一個五年增強現實會越來越普及。

梅濤:你認為是增強現實。

詹東暉:我覺得未來五年工業視覺這一塊會有比較大的突破,因為目前這一塊不僅問題很多,而且市場剛需很大。另外,山老師提到 AI+醫療,醫療領域引入 AI 可以很大改變醫療的現狀。

魏京京:我們也是做工業設計的,非常同意詹總的觀點。我覺得分兩方面,第一方面是未來五年會有一大波機器替代人的過程,包括工業視覺的製造環節和服務環節,很多 AI 演算法會集成到產品裡面把人的工作替代掉,這是不可逆轉、必然要形成的。另外一個,現在 AI 演算法比較重,後面有大批量伺服器支撐,所以後面的趨勢是輕量化,輕量化到我們家庭和身邊,讓更多能夠觸碰到的功能帶到我們面前。一方面是我們後面看不見的很多人會被替代,另外是我們中間會出來很多大家比較驚訝的智能化產品。

趙京雷:我覺得未來幾年對人類生活影響非常大的計算機視覺的應用,一定來自於受眾最廣的領域。哪個領域最廣?一定是手機。未來五年什麼樣的視覺產品會成為爆品?大家只要看蘋果一代一代的會加什麼樣的視覺功能就可以了。如果加刷臉,那刷臉就是爆品,人人都會刷臉,所有硬體都會通過刷臉去登錄。所以未來很簡單,看蘋果這樣一些產品行業的大師怎麼去思考視覺,在對人類生活影響最廣的領域的構思。

山世光:我覺得是醫療,因為醫療真的非常非常重要,每個人都會涉及到去醫院做檢查的問題,所以我覺得醫療肯定是非常大的一個市場。另外一個就是自動駕駛,我不知道大家看不看好,我自己還是覺得未來五年裡面,至少輔助的駕駛系統會逐漸進入到幾乎所有的車上去,這會給大家帶來生活態度、生活方式的變化,我相信一定會帶來。當然,五年之後是不是真的全自動駕駛不好說,全自動駕駛在一些封閉的環境下面、可以拿到高精地圖的場景下面,我相信也是有非常大可能性的,所以我還是非常看好這種。而且我相信自動駕駛領域裡面,視覺 Camera 這種方式應該會超越雷達的方式,使得它能夠更快或者更有可能普及。

梅濤:謝謝世光,世光認為自動駕駛是下一個五年的熱點。我們的圓桌討論非常成功,再次感謝五位嘉賓的參與。其實人工智慧離我們很近,計算機視覺離我們也很近,未來離我們並不遙遠,將來我們可以想象將來身邊圍繞各種各樣的機器人,醫療機器人、無人駕駛機器人、看護機器人、情感機器人,我們人類會變得更加聰明還是更加懶惰,我不知道,但是不管未來怎麼發展,我們人還是會來到這個會場,面對面的具有感情色彩的深入交流。感謝雷鋒網(),感謝 CCF。

以上為雷鋒網整理的圓桌全文,更多資訊請關注雷鋒網。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦