search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

DuerOS現身2017中國機器人行業發展論壇 賦能合作夥伴創造更多可能

慧聰通信網】3月18日,2017機器人行業發展論壇暨第三屆恰佩克頒獎典禮在蘇州圓滿落幕。在百度戰略合作部牽頭下,度秘事業部總經理景鯤出席了本論壇,並在下午舉行的以「服務機器人與人工智慧+」為主題的分論壇上發表主題演講。

現場,景鯤向與會嘉賓們分享了百度在人工智慧領域的投入和想法,並圍繞人工智慧領域的前沿科技熱點展開熱烈討論,共同展望未來。景鯤在現場表示,每一代的操作系統使用的交互方式都是越來越向人最自然的交互方式轉變。在經過第一代以滑鼠鍵盤和第二代用手指跟移動設備交互后,百度希望通過第三代對話式人工智慧操作系統,讓更多的用戶受益,讓更多的用戶能跟設備進行交流,獲得信息和服務。

百度度秘事業部總經理景鯤現場發表主題演講

人工智慧技術的創新蓬勃發展讓機器變得更加「智慧」。景鯤同時坦言,當下人工智慧火熱,但讓用戶通過語音方式跟設備進行交流,讓人工智慧走入尋常百姓家仍任重道遠。百度願意作為一種最基礎的能力開放給合作夥伴,強強聯合真正解決不同用戶場景的需求,把人工智慧做大做好。

以下為演講全文:

大家好,很高興來到蘇州,這不是第一次,但是感覺這一次特別親切。今天希望跟大家分享一下百度在人工智慧方面一些想法和投入,其實聽錢總講了很多人工智慧的東西,特別有啟發。但是後來我發現,無論是從研究還是物聯網、產業,其實大家的想法是趨同的,未來人工智慧會有很多發展,所以今天我在想的是——百度在人工智慧方面的投入,我們下面去做什麼,我們將來想做什麼以及我們現在是怎麼做的,我們如何跟大家一起來合作共贏。

在講之前我先放幾個電影小片段。這個電影叫《Her》,很多人應該都看過,它是一種虛擬的人工智慧,但是用戶可以通過耳機和手機跟它來交互;下面我們再看另外一段影片《鋼鐵俠》的一個片段,賈維斯是另外一種形態的人工智慧,像這種類型的人工智慧基本出現在每一個科幻片裡面,我們會想:如果我們所有看過的科幻片都會有一個這樣的人工智慧存在,它或者是實體的,它或者是虛擬的,但它肯定是無處不在的,它肯定是非常個性化的,這樣的影片不只被我們在這屋子這個行業的人喜歡,它被很多老百姓都喜歡,老百姓喜歡它的原因是它想出了我們希望未來是什麼樣的未來。

所以從人性的角度,我們其實希望未來有這樣的助理服務,幫助我們能提供一些個性化的服務,這是未來,我們是不是能現在達到這樣的未來?人工智慧現在的技術是不是能達到這樣的未來?現在肯定還有很長的路要走,所以我今天分享的路徑就是:如果我們的願景是在這兒,我們腳應該踩到實地上,我們怎麼樣能有一條路從現在走到這裡面,所以我想分享的是百度在這個路徑上是怎麼想的。

百度度秘想做的事是第三代的操作系統,第一代的操作系統是用滑鼠和鍵盤跟用戶交互的,第二類的操作系統是移動時代的操作系統,是用手指在跟移動設備交互的。每一代的操作系統,它使用的交互方式都在越來越向人最自然的交互方式來轉變,而每一代這樣的轉變都在讓更多的用戶受益,讓更多的用戶能跟設備進行交流,能去獲得信息和服務。那最自然的交互當然就是對話式的,所以我們現在做的就是第三代人工智慧操作系統。曾經我們原來跟設備是這樣交互的——在這屋子裡面很多人原來要學輸入法,要學五筆,原來我們都在學習機器的語言,基本上那個時候我們學鍵盤學五筆的時候跟機器的溝通是很費勁的,我們現在想做的,在人工智慧時代,隨著數據、計算力、人才的集聚,我們希望讓機器能學會人的語言。

我們來看一下,平時我們是不是更習慣用我們的語言?這個是整個百度語音的調用情況,我們看到手機百度語音日活用戶在過去一年增長100%,而且這種趨勢是幾年不變的。這是我們最近在手機百度這款日活過億的APP上,增加的一個按鈕叫「按住說話」,從它的使用量、從用戶的表揚上來講,使用率急劇的增加表示人們是更加習慣跟設備用人類自己的語言來進行交流的。

那說一下我們百度的優勢在哪。第一個,最近大家可能從新聞上讀到百度成立度秘事業部,並直接向陸奇彙報工作。其實,有時候尤其是做企業的時候,你會發現在創新時最難改變的是組織的創新,當你解決組織的問題之後,很多創新的問題會迎刃而解。當然,陸奇來了之後,非常高興公司決定升級度秘事業部,作為百度七大事業部之一直接向陸琪彙報工作,當然其他事業部有搜索、金融等就不贅述了。我們再來看今年的兩會,李彥宏的三個提案全部聚焦在人工智慧領域,他非常希望將來無論是桌子椅子將來都是可以變成人工智慧的,都能裝這樣的一個操作系統,用戶可以跟桌子椅子直接去對話。

百度在人才上的投入也很大,除了組織方面,我們百度匯聚了全球在人工智慧全球最頂尖的人才。我們在矽谷有一個幾百人的office做世界最領先的研究,我們在北京、上海、深圳都會取得人工智慧領域最頂尖的人才。在技術方面,我們應該是在世界領域內都走到最前沿的一個公司,現在涉及到人工智慧的領域,我們基本上都是研發了五年以上,語音板塊中,2014年MITVB全世界突破性技術的第二名是百度語音,我們在百度語音上做了很多工作,包括我們非常自信地把百度語音放到手機最下面的一欄。當然只有語音還不夠,我們在自然語言方面的投入也很多,我們把自然語言模型用到了我們搜索、廣告以及人工智慧對話系統上;在圖像方面,很多人臉方面的應用正在落地,像是百度大廈安裝了人工智慧刷臉機,每天幾萬個員工通過刷臉進入百度大廈。

其實這些技術是不夠的,因為用戶要的不是技術,用戶要的是端到端的能力、端到端的內容。百度在信息和服務生態方面做了非常多的儲備,百度搜索本身就是一個大生態,我們所有跟搜索相關的信息和服務生態都可以跟對話式的交互進行溝通。我們會把整個百度的能力打通,還會引入很多第三方的合作夥伴在我們的操作系統上去開發內容。所以將來在交互系統上彙集的能力不只是百度的能力,還有很多來自其他合作夥伴開發的能力。

我們現在看到度秘目前提供的內容是非常多的,基本上每天都在增加。所以今天度秘的功能可能已經不止是70個了,可能是170個。舉幾個例子,剛才說知識的運用很重要,搜索引擎是最大的知識庫,利用搜索引擎的知識庫,我們每天看到有很多用戶的交互。我們為什麼要做語音搜索呢?是因為語音搜索能讓我們看到的數據跟原來傳統的關鍵字搜索不一樣,關鍵字搜索的時候,用戶打北京空格天氣,這是機器的語言,就是搜索引擎的語言,這不是人的語言。人的語言是說明天蘇州下雨嗎?後天蘇州冷不冷?所以在我們加上語音交互之後,很多用戶用更口語化的方式在跟百度搜索進行交流,每天我們看到非常多這種口語化的表達,而這些口語化的表達就是用戶每天在正常生活中的表達,我們看到的這些數據、知識,是從整個百度搜索大知識庫上挑取的知識。

除了剛才的一些百科知識,當然搜索上的我們原來叫阿拉丁系統結構化的知識非常多,涉及到生活領域的方方面面。比如說我們最近跟海爾和美的合作在做智能冰箱,他們特別需要的一個知識是菜譜知識,對於他們來說抽取菜譜、維護菜譜的更新很難的,但是對搜索引擎來講易如反掌,我們也很願意把這些能力免費的開放給我們的合作夥伴。所以從整個百度信息方面的能力來講,數以萬計的能力都會作為通用的支持開放給我們合作夥伴來使用。

我們可以很自豪的說,我們對點評數據的理解可能比點評還懂點評,我們為什麼能懂這些數據呢?因為傳統方式是用人工去打標籤,最多打一百個標籤可能就夠了,我們是怎麼打標籤的呢?因為我們是搜索引擎,所以我們能抓到用戶的評論,用戶評論裡面評論了什麼?這些評論都是標籤。原來的話用戶說我想找一個可以帶狗去的餐廳,在點評裡面是找不到的,但是在真實情況下用戶是有這種需求的,因為用戶的評論中會評論這家好像可以讓我帶狗去,所以我們把它的標籤從一百個增加到了10萬個甚至到了千萬個。這個例子也展示了我們多輪對話的一個能力。

原來我們講通用人工智慧開放到門非常難做,但是我們把這種能力限制在一個具體場景裡面的時候,複雜度急劇降低。如果我們看到這個提醒——上海降溫五度,這個是用戶的一個真實需求,我們還有用戶真實需求是霧霾的時候提醒我出門戴口罩,人是很難每天去看時間、溫度、霧霾的,但如果機器能有這種提醒能力,在某一個垂類裡面是可以做的很好的,所以我們把這種通用智能能力的願景,把它變小變成場景化,跟一些具體垂類和場景相結合,會解決用戶很多實際的問題。

所以今年拉斯維加斯我們正式對外宣布的第三代的對話式人工智慧操作系統,我們希望它是無處不在的,它是可以被很多合作夥伴服務的,而且是免費服務的。我們今年已經宣布了跟很多家企業合作,從小魚在家(一個智能機器人)到海爾、聯想、小米等等,我們的合作夥伴來自各行各業,只要他們希望用對話式的能力我們都會免費的,跟大家一起去開發這個市場,所以也獲得了一些行業大獎。

這個例子比較有意思,是我們做的一個TV,可以給大家看一下。原來我們跟電視進行交互是非常困難的,搜索體驗基本是非人的體驗,但是剛才看到有了語言能力之後,用戶跟電視就可以非常簡單的進行交互,而且剛才最後一個例子我不知道大家是沒有注意到,我們可以直接跟電視問這個人是誰?原來的做法是基本上是對電視進行標註關鍵詞,但是用戶往往在任何情況下都可能會問,我們的做法非常簡單粗暴,我們把一個電視前幾幀全部截下來發到雲端,通過圖像識別能力把用戶跟圖像內容互動起來,想象一下,我們看到電視裡面的明星不認識時,我們會問明星是誰,或者我們看到這個車不知道是什麼品牌時,我們們看到這個人穿的衣服很漂亮想找同款時,用戶可以用這種語音加圖像的方式跟電視互動起來了。

這個例子是我們大概在今年拉斯維加斯做的一個機器人的例子。參與演示的是吳恩達,他基本上不太會說中文,可以看到我們的語音識別連「蹩腳」的中文也能識別。然後剛才這個例子比如小魚在家,我們可以把它假想成在美國,加上一個屏幕加上一個攝像頭之後用戶的交互能力就會變得很不一樣。

剛才他講述的例子是鎚頭鯊的圖片,其實這是在我生活中真正發生的,我平時跟我兒子在一起玩的時間特別少,所以我陪他玩的時候他特別煩我玩手機。有一次,我給他講鯊魚的故事,講到鎚頭鯊的時候他說爸爸什麼是鎚頭鯊,其實真的很難用語言去描述鎚頭鯊的樣子,因為你說腦袋就是那樣的是很難描述的,我說我給你找一下。當我把我手機掏出來,他說爸爸你不是跟我說不能玩手機嗎?你怎麼還自己玩手機?這時候旁邊如果有個鎚頭鯊的圖片能夠出來,我的三歲的兒子就能瞬間明白了什麼是鎚頭鯊。所以有了這樣的設備之後,在家庭場景裡面就會有很多想象力。在百度的平台上我們不只開放單項能力,我們希望把我們的語音對話人臉和我們大數據全部開放給我們的合作夥伴,跟夥伴合作夥伴攜手把這個體驗來做好。

其實最後想說一句,人工智慧現在非常熱,但是人工智慧的落地,走入尋常百姓家還是非常大的挑戰,怎麼能夠讓用戶形成認知,讓用戶用語音的方式跟設備進行交流,這個巨大的市場需要我們整個行業的人一起去努力。今天在下面聽完很多嘉賓對整個人工智慧行業的做法和暢想后,我們也希望跟所有的用戶、客戶一起聯手,大家一起把人工智慧做大做好。百度非常願意作為一種最基礎的能力,免費的跟合作夥伴走到一起,強強聯合把真正用戶的場景做好,把用戶的需求解決好,所以這就是我們百度想做的。

謝謝大家。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦