search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

人工智慧究竟能幹什麼?這家公司告訴你美顏背後的技術

配圖

突然所有的領域都叫人工智慧了,但現在的人工智慧就像2008年的移動互聯網,還不成熟。

這是創新工場聯合創始人、被李開復稱讚為」天才「的汪華在上周的一次採訪中談到的,他認為人工智慧有點」早熟「,但進入各行各業還需要一段時間。

但這並不妨礙越來越多的公司舉起人工智慧的標牌,儘管他們連訓練機器的數據都沒有。

那麼,如何判斷一家公司是不是人工智慧?

商湯科技CEO徐立是這麼說的:」你就看他每個月花在標註數據上的錢。「採集(購買)數據當然要花錢,但標註數據——向機器描述什麼是一盆花、一個瓶子,讓他去學——這需要非常多人力,所需成本遠遠高於採集數據。而這些又是必須的,因為不做這些機器就沒法學習。

徐立說一些投資人按這個方法去篩選,效果不錯。

商湯科技就是一家專註於計算機視覺和深度學習原創技術的公司,成立兩年多,已將他們的技術用在了各行各業。比如用小咖秀、Faceu戴兔耳朵、吐彩虹,背後就是商湯科技提供在技術。銀聯的人臉識別項目,也是和他們合作。語音識別領域有了科大訊飛,有潛力角逐圖像識別戰場的,商湯科技算一個。

玩faceu的Anglebaby

誕生於實驗室的創業公司

商湯科技誕生於香港中文大學的多媒體實驗室,學術研究貫穿了整個公司的發展。

這個實驗室在湯曉鷗教授的指導下,從2011年開始將深度學習應用於視覺領域,在2012、2013年IEEE國際計算機視覺與模式識別會議上(ICCV/CVPR)共發表了14篇關於深度學習的文章。讓他們變得更為人所知的,是在2014年LFW檢測中人臉識別的準確率首次超過人眼。

這些成果引起了資本的注意。公司尚未成立,IDG資本就找上這個團隊。投資新技術的IDG合伙人牛奎光找到他們,討論成立公司的可能性。團隊雖然也有這個想法,但並沒有想完全通過融資來促成這件事。IDG闡述了資本在加速和背書方面的作用,團隊決定成立一個公司。

如果沒有資本的加入,他們也會考慮成立公司,」但是增長的速度會慢一些,因為創業的不確定性還是很大。「徐立回憶說。

於是在2014年10月,幾個香港中文大學的畢業生、微軟前員工加上一些清華畢業的研究人員,成立了商湯科技,當時就已經有了十幾人的規模。

而徐立卻是在2015年年初加入的。從香港中文大學出來后,徐立在香港新成立的聯想研究院工作了兩年(從這個效仿微軟研究院的研究機構出來的一些人,此後也加入了創業公司擔任技術要職,例如大疆創新科技的核心視覺團隊)。

商湯科技CEO徐立

徐立和香港中文大學多媒體實驗室的成員關係都很好,加入后做了公司CEO。」我覺得我們的團隊一開始都很學術,可能是我比較不學術。「徐立說了句玩笑話,實際上徐立大學部與碩士、博士分別畢業於上海交通大學和香港中文大學,並繼續在香港中文大學做了一段時間博士后,也是學術型創業者。

用AI技術改造的」良田「

要說學術型創業者的優勢,眼光和預見性是第一位的。讓機器倒咖啡、自己送小孩這些短期內肯定做不到,他們知道哪些行業能被技術顛覆——拍照應用、安防、金融、地圖測繪,這些才是現階段技術能改造的良田。

美圖是商湯科技早期合作夥伴之一。在拿到美圖的訂單后,商湯科技陸續和Faceu、小米相冊、華為相冊等簽訂了合作。機器識別出人的五官,然後再加上各種效果,這種玩法已經走進了各種聚會。在360手機上,則可以先拍照后對焦,或者把照片變成大光圈的效果。

商湯科技的客戶中,還包括一些做土地規劃的企業。一般情況下,地圖需要人去標註,開車驗證道路、農田,商湯科技利用遙感數據,可以把不同的用地都標註出來,省去人力成本。

儘管商湯科技已經和華為、小米、新浪微博、京東、銀聯、移動等開展了合作,但實際上他們的商業化也不過一年。

這是研究和實際應用之間存在的時間差。在公司成立之初,商湯科技也向很多公司推銷他們的技術,結果卻發現很多研究距離產品化卻還有一定距離。只考慮解決問題的研究代碼和和講究效率的工程代碼完全是兩個概念,這個由博士組成的團隊花了一年時間在工程研究上,也有更多微軟工程員工加入進來,才慢慢形成較為先進的工程管理模式。

目前,商湯科技和企業的合作模式主要有三種:SaaS模式,商湯科技提供介面,用於身份證識別、卡號識別、票據識別等;終端模式,提供軟體、硬體一體的設備;第三類是為公司建立一個超算平台,他們提供服務,金融、安防等領域常用到后兩種合作模式。

在商湯科技的辦公室里,還有一個尚未完成的體感遊戲,只在電腦上裝一個軟體和一個普通攝像頭,就能代替微軟的體感遊戲設備Kinect,這是商湯科技下一步想要實現的。

在辦公室外、商湯科技位於的這條五道口街區」智造大街「上,已經裝上了一種叫槍球聯動的攝像機。在幾百米外,可變焦的球機能清晰抽取目標人臉,與庫中數據做對比,或是識別年齡、性別等各種屬性。在人來人往的廣場上,那些滯留較久的人群會被標上不同顏色,球機瞄準後來張清晰照,沒準就能發現什麼正在進行中的交易。

現在這些攝像機由商湯科技的子公司商周銳視製造,商湯科技的其他子公司還包括做金融、徵信、大數據的Linkface,與東方網力合資的公司深網視界。

配圖

商談科技辦公室內展示的智能視頻解決方案,能比對目標人物,查看人員流動率

人工智慧進入」鋪軌道「期

在介紹這些業務時,徐立拿出了給客戶看的PPT,向我介紹為什麼他們能做到這些。

他說到他們自己的深度學習平台Parrots,如果不是三四年前就開始做,那麼他們可能會使用已經成熟的TensorFlow(這個谷歌開發出來用於深度學習的開源框架現在備受追捧),但商湯科技還是用自己的平台更加得心應手。

機器學習需要用到的數據,也是累積的結果。比如商湯科技已經幫4.6億人進行了身份驗證,1.6億人的數據來自於SaaS服務,另外3億人的數據來源是移動的實名認證合作項目。

去年年底剛完成新一輪1.2億美元融資的商湯科技現在已有400多位員工,算上實習生等共600人,其中有60多人有博士學位,分研究、工程、銷售三部分。目前他們已在京都建立了第一個海外工程部門,並和一些日本的公司達成合作,但徐立並未透露具體公司名稱。

徐立在採訪中興緻勃勃地講起深度學習鼻祖Geoffrey Hinton,他做的深度神經網路從上世紀80年代到本世紀初一直不被主流研究認同,直到2011年他和微軟做的一個語音識別項目獲得成功,由大數據指導的智能模式才代替由人工指導的智能模式,成為主流。

也是在2011年,數據的積累達到一定程度,GPU能承擔起深度學習的運算,人工智慧時代到來,商湯科技的早期團隊才將實驗室中將重心放到了這個方向。

現在,人工智慧進入了基礎設施鋪建期,就像火車普及之前的軌道,搭建底層架構需要的經費可能讓企業對它望而卻步。徐立的判斷是,鋪軌道的階段會有三五年,接下來,就是三五十年的繁榮期。那些可能因為人工智慧失業的人,正是需要解放出來的勞動力,能夠去做更有意義的事。

就在商湯科技辦公室的樓下,五道口熙熙攘攘。走在」智造大街「上的人們行色匆匆地趕去捷運站,或是說說笑笑地奔向今晚的飯局。他們不知道的是,這些都被槍球聯動攝像機記錄了下來。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦