人工智能正以看得見的速度成為人們熱愛談論的話題,人工智能也正以看不見的速度逐漸滲透普通人的生活。
從大部分人看不懂的理論到每一個人都會使用的產(chǎn)品,技術到應用的轉化,通常與工業(yè)界的探索息息相關。
在人工智能熱潮大背景下,智能駕駛、NLP/人機交互、圖像識別、語音識別、大數(shù)據(jù)、智能硬件等不同分支都涌現(xiàn)了大量先行者。
無論是大公司還是初創(chuàng)企業(yè),在追逐自己商業(yè)夢想的同時,它們的努力,也將影響人工智能落地日常生活的具體形態(tài)。它們是將人工智能與普通人連接起來的橋梁,是窺探人工智能發(fā)展的一個窗口。
為此,深藍將對人工智能不同方向內(nèi)最具代表性的公司進行報道,了解技術,剖析商業(yè),一同看清潮水的方向。
語言是人類溝通的重要工具,是人類傳達信息的基本載體。NLP(自然語言處理)旨在幫助機器理解人類的語言,通過理解語言來理解人類的想法和意圖,是人工智能中最具魅力和挑戰(zhàn)的問題之一。NLP的進步,會直接影響人類與機器溝通的效果。
因此,深藍的第一個系列報道將以NLP為主題,我們選取了國內(nèi)NLP領域最具代表性的企業(yè),圍繞他們的技術路徑、商業(yè)模式,進行深度解析。
NLP系列第二篇|專訪三角獸:開放域聊天是終極理想未來將打造虛擬偶像
左至右分別為亓超、馬宇馳、王卓然
基本信息
成立時間:2016年2月
產(chǎn)品能力:開放域聊天、任務驅動的多輪對話、跨域中控、智能問答
團隊情況:
創(chuàng)始人、CEO王卓然,英國 UCL 博士,前度秘中控決策負責人,前東芝歐洲研究院對話系統(tǒng)組技術負責人。
創(chuàng)始人、CTO亓超,前微軟小冰、百度度秘開放域聊天技術創(chuàng)始人。
創(chuàng)始人、董事長、COO馬宇馳,曾在 Viacom、奧美公關、Amway China 負責廣告、公關和品牌。
融資情況:
2016.4,天使輪,1000萬人民幣,洪泰基金和天善資本
2016.9,Pre-A輪,2000萬人民幣,君聯(lián)資本和賽富
2017.1,A輪,5000萬人民幣,東方網(wǎng)力旗下博雍基金、恒生電子和索道資本
文/深藍 韓依民
三年前,當亓超從時任微軟Bing中國首席研發(fā)總監(jiān)的景鯤手中接下后來被稱為“小冰”的任務時,沒有人能想到人機交互會成為時下最熱門的創(chuàng)業(yè)方向之一。
在小冰之前,一度風靡人人網(wǎng)的小黃雞曾短暫的將人機交互帶入大眾視野。小黃雞在社交網(wǎng)絡上受到的追捧,讓微軟中國產(chǎn)生了做一款類似產(chǎn)品的想法。
創(chuàng)造小冰,本意是為擴大微軟Bing搜索在中國市場的認知度,它被寄予了能產(chǎn)生病毒式傳播效果的期望,為了提升營銷噱頭,團隊還邀請“奶茶妹妹”章澤加入任實習產(chǎn)品經(jīng)理,并對外表示希望小冰能成為一名類似章澤天的萌妹子。這些精心的安排讓小冰問世后在傳播上收到了不錯的效果。
小冰的命運并沒有僅僅停留在營銷功能上,這款人機對話產(chǎn)品已經(jīng)成為微軟中國在搜索之外講述的另一個重要故事,它被認為是下一代操作系統(tǒng),在微軟中國之后,百度推出了自己的度秘。如今,小冰和度秘是國內(nèi)最為知名的兩款語音交互產(chǎn)品,在國外,亞馬遜的Alexa也已經(jīng)通過Echo走進更多人的生活。
技術進步的浪潮是小冰們受到追捧的根本原因,深度學習的突破,讓機器聽清、看清甚至理解人類都變得更加可行。
但回到小冰故事的開頭,算法工程師亓超在技術路線上的決定,為小冰得以成功提供了現(xiàn)實基礎。“拋棄原來的方法重做,一開始就遵循兩個原則:大數(shù)據(jù)和深度學習。”
亓超
半年時間里,亓超與其他四位前端工程師,從第一行代碼開始創(chuàng)造了小冰。彼時為小冰定下的技術路線,正是當下最熱的人工智能的核心,這為亓超在人機交互領域贏得了知名度。
在從微軟小冰團隊跳槽到百度,又從百度度秘團隊離職后,亓超選擇了創(chuàng)業(yè),他現(xiàn)在的身份是人工智能初創(chuàng)公司三角獸的創(chuàng)始人,與他一同創(chuàng)業(yè)的還有同樣來自百度度秘團隊的王卓然。
亓超的前同事與前前同事組成了三角獸的核心技術團隊,既往經(jīng)驗成為他們決心攻克最難挑戰(zhàn)的自信來源,同時也是三角獸確立技術、產(chǎn)品、商業(yè)模式發(fā)展方向的重要參考。
攻堅開放域
創(chuàng)業(yè)伊始,三角獸就把開放域聊天當做了重點攻克對象。
不限定領域、不限定目的、不限定話題,讓人與機器之間真正像兩個朋友那樣對話,被稱為開放域聊天。
在三角獸剛剛裝修完的新辦公室,深藍見到了亓超,從去年2月創(chuàng)辦到現(xiàn)在,三角獸的規(guī)模在迅速擴張,為此,他們不得不新裝修了一塊場地,以容納正在壯大的隊伍。
開放域聊天是三角獸技術團隊當前的工作重點,亓超介紹,“三角獸希望下一步是做有內(nèi)容、有營養(yǎng)的對話,我們希望從原來基于內(nèi)容的對話聊天變成基于興趣的聊天。”
這其中的技術難點在于,當用戶與系統(tǒng)進行沒有明確目的的閑聊時,系統(tǒng)需要根據(jù)對全網(wǎng)聊天數(shù)據(jù)的學習和理解,對任何話題作出高相關性回應,保證對話持續(xù)進行。
換言之,用戶輸入的信息不限定領域,用戶給出的信息可能天馬行空,機器在結合上下文語境準確理解用戶語義的同時,需要從龐大的數(shù)據(jù)庫中,給出準確的回應,這要比問答、垂直領域的實現(xiàn)難度高出許多,因為在問答或者垂直領域對話中,限定了用戶只能與機器聊特定領域的話題,而機器也只能輸出特定領域的答案。
構建知識圖譜,以及標注和結構化特定域數(shù)據(jù)進行深度學習,是行業(yè)當前在問答、垂直領域對話中通行的技術方法,但這些技術方法很難解決開放域聊天的問題。
亓超介紹,開放域聊天對技術架構、數(shù)據(jù)量級都有非常大的改變。在數(shù)據(jù)采集范圍上,三角獸從公開網(wǎng)絡上抓取了500億組的數(shù)據(jù)集,數(shù)據(jù)量非常龐雜,因此用人工標注處理數(shù)據(jù)的方法是不可行的,必須通過深度學習讓機器去發(fā)現(xiàn)規(guī)律。這正是實現(xiàn)開放域聊天的最難點。
“上千萬的語料是很難(人工)標注的,盡可能讓機器自動學習到一些規(guī)律,在之前需要人來設計很多特征,現(xiàn)在它有一部分的工作是自動學習一些標識,完成了人原來定義的一些特征和狀態(tài),這也是深度學習很重要的一個體現(xiàn)。”
復制的可能
正是因為實現(xiàn)真正的開放域聊天是技術難度比較高的事情,很多NLP方向的AI初創(chuàng)公司均選擇以問答或者特定域對話為切入口,但三角獸并不打算這么做。攻堅開放域除了NLP算法工程師對挑戰(zhàn)難題的天然熱愛,更重要的原因則是來自用戶需求的反饋。
身為一名資深的NLP算法工程師,亓超有時候會跟同事開玩笑:我看到的語料可能比你讀的書要多,“你要不看語料,你沒有辦法理解這個事情應該怎么做,做到這樣的程度你才能夠有積累做這個事情。”
三角獸創(chuàng)始人、COO馬宇馳和CEO王卓然是高中同學,而亓超是王卓然在百度的同事,三角獸的其他幾位技術合伙人均來自微軟和百度。
小冰以及度秘的經(jīng)歷,讓亓超積累了大量經(jīng)驗的同時,也讓他及其團隊認知到用戶對于人機交互的最核心需求是什么。
在亓超看來,很少有人會想到去問機器“天空為什么是藍色的”、“兔子的眼鏡為什么是紅色的”,類似“謝霆峰的前妻演過什么電影”本身就是偽需求。而這兩種問題,恰恰是問答及垂直域對話的典型演示案例。
“你不能認為問答是對話系統(tǒng)的全部,很少有人這么去問,實際上問答類的需求在成型的對話機器人只占到1%到2%的量級。”亓超介紹,“我們希望讓機器人更主動拋出一些東西,而不是被動等著你來問我一些知識的問題。”
同時,亓超認為,類似“謝霆峰的前妻演過什么電影”的提問也并不符合人類的表達習慣,而且,利用知識圖譜實現(xiàn)特定域對話有非常大的局限性,首先當數(shù)據(jù)量大到一定程度,實體與實體間的關系是一個爆炸組合,想建立一個完備的圖譜,用一個圖譜來描述整個世界并不可能;而一旦用戶的提問超出了知識圖譜的范圍,那機器人就無法回答下去。
從過往數(shù)據(jù)來看,聊天意圖占到對話中所有意圖的60%、70%以上,意即用戶問100個問題,有60或者70個問題屬于聊天,“這是誘導我們要發(fā)力做這個事情的一個原因”。
同時,開放域聊天的技術實現(xiàn)方法可以復制到其他領域,意義重大:當你攻克了最難的問題時,其他的困難也就迎刃而解。
打造虛擬偶像
事實上,三角獸已經(jīng)開始嘗試將開放域聊天打造成一個標準產(chǎn)品對外銷售,這樣可以避免像傳統(tǒng)2B生意一樣,圍繞客戶一個項目一個項目的做,更易規(guī);。
對三角獸而言,輸出產(chǎn)品、對外銷售落地不僅是獲得商業(yè)回報的必經(jīng)之路,同時也是通過實踐獲得反饋不斷完善技術的重要方法。
“我們不會閉門造車,要在實際的場景遇到實際的問題,我才知道我要解決什么問題,需要發(fā)展什么樣的技術去解決這些問題,才知道技術迭代的方向,而不是閉門做demo。我們?nèi)绻话鸭夹g落到實際,不知道實際需求是什么,也不知道技術落地會產(chǎn)生什么問題,會回收一些偽需求,這個不實際。”
基于完善技術能力的出發(fā)點,三角獸非常注重落地,而在常見的2B端業(yè)務外,三角獸還有2C端生意的設想。
企業(yè)服務、IoT與泛娛樂,是三角獸為自己定下的商業(yè)版圖。
三角獸官網(wǎng)呈現(xiàn)的產(chǎn)品方案
據(jù)馬宇馳介紹,目前他們已經(jīng)獲得了包括光明網(wǎng)、新世界、恒生、新浪微博等客戶,輸出的能力既有開放域聊天、多輪對話也有中控決策。
企業(yè)服務是當前人工智能初創(chuàng)公司的最主要業(yè)務模式,將語義技術植入到現(xiàn)有場景中讓機器人擁有交互的功能,以及智能客服,是三角獸企業(yè)服務的兩大主要場景。
IoT業(yè)務則主要包括與手機廠商、電視廠商、智能音箱廠商等合作,輸出語義理解、垂直領域多輪對話等能力,為硬件裝上大腦。
企業(yè)服務及IoT業(yè)務均不難理解,它們也是當下AI初創(chuàng)公司的主要商業(yè)模式,但在三角獸的商業(yè)規(guī)劃中,未來,基于開放域聊天能力,他們希望能夠打造出虛擬偶像,以技術為切入點,進入泛娛樂領域。
馬宇馳介紹,之所以想做泛娛樂,一方面是因為2C業(yè)務體量更大;另一方面則是隨著粉絲經(jīng)濟、二次元經(jīng)濟的發(fā)展,虛擬偶像的市場已經(jīng)存在并且具有很大想象空間。
目前,泛娛樂業(yè)務仍處于規(guī)劃和設想階段,技術實現(xiàn)程度以及IP是限制業(yè)務落地進展的主要原因。但基于技術上的積累、與合作方的順暢溝通以及團隊的能力,馬宇馳及亓超均懷有很大自信。
“我們已經(jīng)慢慢在構建自己的壁壘。”
新聞熱點
新聞爆料