“尋找賈維斯”簡史-創(chuàng)新互聯(lián)

可能人人都希望自己有個“賈維斯”。

創(chuàng)新互聯(lián)自成立以來,一直致力于為企業(yè)提供從網(wǎng)站策劃、網(wǎng)站設(shè)計、網(wǎng)站設(shè)計、成都網(wǎng)站制作、電子商務(wù)、網(wǎng)站推廣、網(wǎng)站優(yōu)化到為企業(yè)提供個性化軟件開發(fā)等基于互聯(lián)網(wǎng)的全面整合營銷服務(wù)。公司擁有豐富的網(wǎng)站建設(shè)和互聯(lián)網(wǎng)應(yīng)用系統(tǒng)開發(fā)管理經(jīng)驗、成熟的應(yīng)用系統(tǒng)解決方案、優(yōu)秀的網(wǎng)站開發(fā)工程師團(tuán)隊及專業(yè)的網(wǎng)站設(shè)計師團(tuán)隊。

雖然已經(jīng)退出漫威電影很多年,但是我們還是能夠記起那個鋼鐵俠戰(zhàn)衣里無所不能的AI助手。獨特的幽默、優(yōu)雅的語調(diào),以及非常靠譜的人設(shè),讓無數(shù)科幻迷對這個看不見聽得到的角色產(chǎn)生了無盡好感。

對賈維斯的迷戀有多瘋狂呢?我見過賈維斯版本的電腦桌面程序,賈維斯模樣的手機(jī)UI,以及以賈維斯命名的AI算法。設(shè)計師和極客們,迄今為止想了無數(shù)辦法來“復(fù)活”屬于自己的賈維斯。

“尋找賈維斯”簡史

然而畫面越來越逼真的賈維斯界面,顯然無法得到它的精髓:像朋友一樣的溝通與陪伴。

假如說有某種技術(shù)希望能夠在“本質(zhì)”上尋找賈維斯,那么一定非語音助手莫屬。

由于身處一個科技爆炸的年代,日常生活中我們可能不太留心某種技術(shù)的發(fā)展。但是如果一旦停下來回頭看看,會驚奇地發(fā)現(xiàn)一門技術(shù)原來經(jīng)歷了相當(dāng)驚人的變化。比如說手機(jī)中的語音助手,已經(jīng)成為了日常生活的一部分。而如果回首一下它的歷史,說不定會大吃一驚:原來用語音助手復(fù)活賈維斯,并不是說著玩玩的?;乜催@些年語音助手的成長,會發(fā)現(xiàn)在人性化交互、應(yīng)用能力拓展,以及功能集成上,語音助手的體驗確實在一步步逼近“賈維斯”這個終極目標(biāo)。

最近好像流行寫各種簡史,那不妨讓咱們今天來講一段,關(guān)于“尋找賈維斯”的簡史。不難發(fā)現(xiàn),語音助手的進(jìn)化軌道,其實已經(jīng)非常清晰明確。

語音助手初長成

大家都知道,最早的語音助手是蘋果推出的Siri。

想當(dāng)年,在大家都沒跟手機(jī)說過話的時候,Siri真的可謂是叱咤江湖?!渡畲蟊ā防锷踔劣幸患?,專門安排拉杰什和Siri談了回戀愛。

然而要承認(rèn)的是,技術(shù)必然有其階段性。就像老爺車雖然經(jīng)典,但是肯定無法開上21世紀(jì)的高速路。初始階段的Siri,在今天來體驗其實是很初級的。

語音助手這件事,之所以得到了蘋果的大規(guī)模投入,其實主要是云計算系統(tǒng)的功勞。其實更早時候,語音助手的雛形已經(jīng)出現(xiàn)。只是當(dāng)時云計算體系沒有鋪開,只能把若干語音指令存儲在手機(jī)中,這導(dǎo)致用戶的問答模板過分單調(diào)。

“尋找賈維斯”簡史

而從Siri開始,語音助手完成了云端部署。這樣可以在云端存儲大量的對應(yīng)模板,并且實時更新,從而讓語音服務(wù)成為可能。

這時候的Siri雖然知道的多了,但是智商卻十分堪憂。由于當(dāng)時的語音助手完全是模板化的,換句話說你必須準(zhǔn)確說出了問題,并且被Siri準(zhǔn)確識別了,才能給你找出對應(yīng)的答案。

然而套路終歸是套路。那個時候,應(yīng)用Siri的體驗大概是這樣的:

Siri,幫我給xx打電話

好的,已經(jīng)撥打

Siri,幫我打個電話,我要聯(lián)系xx

對不起,Siri沒有聽懂……

總之就是,模板不能錯一點點,否則就是推到重來。好在,這種語音助手完全比拼模板數(shù)量的時代,很快就過去了——因為AI來了。

AI來了之后

早期語音助手的大缺點,在于問答只能模板化。用戶實際上不是在跟語音助手聊天,只是把遙控器換成了語音操作而已。這在某種程度反而是增加了用戶的交互成本,同時也讓用戶心中對于“語音助手”這個概念的智能化期待大打折扣。

好在AI來了。

隨著深度學(xué)習(xí)的復(fù)興,以神經(jīng)網(wǎng)絡(luò)處理語音任務(wù)逐漸成為主流。隨著AI加入,語音助手開始呈現(xiàn)語義理解、多輪對話,聲音合成等能力,并且在這幾條軌道上不斷發(fā)展。于是我們看到了語音助手的聽力越來越敏捷,很多情況能夠和用戶像正常聊天一樣說下去。甚至方言、兒童音等問題都得到了一定程度的解決。

這個時期的語音助手,最具特色的代表應(yīng)該是谷歌語音助手Google Assistant和微軟小冰。前者去年曾經(jīng)創(chuàng)造過模仿真人打電話而不露餡的“壯舉“,而后者也常年活躍于聊天界,以不被發(fā)現(xiàn)是AI而著稱。

“尋找賈維斯”簡史

這個時候的語音助手體驗,已經(jīng)有了比較明顯的升級。比如用戶說我想打個電話/幫我打個電話/幫我查一下某人的號碼,然后打電話,語音助手基本都能明白。

而且在深度學(xué)習(xí)的幫助下,語音助手還能記住用戶的聊天習(xí)慣,時不常還能跟用戶逗個悶子,聊天時立個人設(shè)。

然而這并不是終點。隨著AI語音助手的普及,尤其是在手機(jī)中的廣泛應(yīng)用,用戶發(fā)現(xiàn)它能干的事情還是太少了?;揪屯A粼诖螂娫?、發(fā)短信、整理日程表等幾種。然而這幾種在今天已經(jīng)是名副其實的邊緣應(yīng)用。

只能聊而沒啥用的語音助手,就好像賈維斯只能陪著托尼瞎聊天,卻無法啟動鋼鐵俠戰(zhàn)衣——這顯然是嚴(yán)重影響票房的。

在移動AI覺醒的這兩年,隨著終端AI處理能力越發(fā)強(qiáng)大,事情開始有了更多發(fā)展。

折疊出人性化交互

在語音助手的進(jìn)化上,有兩件事決定了今天的故事走向。一個是客觀上來說,無論是端側(cè)還是云側(cè)的AI處理能力都在變強(qiáng)。許多之前無法觸發(fā)的AI應(yīng)用開始變?yōu)楝F(xiàn)實,這些能力就像鋼鐵俠的裝甲和武器,讓語音助手有更多可以操縱的空間。

更明顯的改變來自于消費者和廠商,對語音助手這件事發(fā)生了主觀上的升級。過去語音助手作為一個“嘗鮮品“,主要能力是顯露自己多么智能強(qiáng)大。而在今天,已經(jīng)習(xí)慣語音交互的用戶需要的是”以我為主”,讓語音助手提供服務(wù),而不是炫技。

眾所周知,我們在手機(jī)中的主要服務(wù),是基于APP產(chǎn)生的。那么語音助手的下一步也就是要融合到APP當(dāng)中,把服務(wù)抽象出來,帶給用戶方便。比如三星的Bixby最先嘗試了打穿APP的方案。

這主客觀兩個條件結(jié)合,構(gòu)成了今天語音助手的主要升級方案:折疊交互,融合應(yīng)用,體現(xiàn)人性化。

在這條路上已經(jīng)有了不少參賽者,而目前能夠看到將語音助手這件事推到新高度的,是剛剛更新的EMUI9.1。

“尋找賈維斯”簡史

小藝這個名字,對于華為用戶來說并不陌生。而EMUI 9.1版本的小藝經(jīng)歷了一個跨度非常大的升級。從整個語音助手發(fā)展歷史的角度看,這些升級也可能十分重要。咱們還是基于幾個場景的變化,來研究一下小藝剛剛帶來了什么。

1、能聽能說,也要能看

語音助手這東西,大家已經(jīng)默認(rèn)其能力就是聽和說。然而實際上,一個真正的“助手“還需要一個基本的能力,那就是“察言觀色”。

之所以語音助手一直缺乏“看”這個層面的能力,原因很大程度在于大部分手機(jī)還無法承載復(fù)雜的AI視覺計算。這個領(lǐng)域華為這兩年一騎當(dāng)先,自然也就孕育出讓語音助手走向聽說看全能的基礎(chǔ)。

在EMUI9.1版本中,小藝開啟了多模態(tài)融合交互。之前,用戶想用手機(jī)識別花草、汽車之類的,需要點開攝像頭或者專用APP。這個流程其實有點繁瑣,而且很多一閃而逝的風(fēng)景可能就要錯過。

而新的小藝,則可以讓用戶長按電源1秒就喚醒它,直接對手機(jī)說“這是什么”,語音助手就會自動識別花草、汽車等等。這個能力更有用的地方是識別食物卡路里,可以直接語音問手機(jī)“我吃這個會不會胖”,然后小藝就會自動開啟卡路里識別,報出食物的卡路里數(shù)量。小藝還會根據(jù)識物的卡路里級別,建議你少吃還是放心吃。估計也就是小藝才如此友善,同樣的問題問朋友,他們大概會說“你吃空氣也會胖”。

看的目標(biāo)不僅是基于攝像頭,同樣也可以看到手機(jī)里的圖片。小藝的視覺結(jié)合,另一個玩法是用語音搜圖。比如用戶可以說“找到我女朋友去年的照片”,手機(jī)就會在圖庫眾多的圖片中找到你想要的。

2、穿透APP來服務(wù)你

我們今天的生活,就是在無數(shù)APP中穿梭。同時也要承認(rèn),很多功能其實隱藏在APP深處,想要完成是有點麻煩的。

舉個例子,在你口渴難耐時,想要去自動售貨機(jī)買瓶水。一頓操作終于選到了合適的飲料,這時提示你要掃碼付款,然后此時要先經(jīng)歷找到支付寶,打開支付寶,點擊掃碼——這個過程中每一秒都是煎熬。

而在EMUI9.1的升級中,小藝加入了更多用語音解鎖APP場景的功能。比如上面這些操作,現(xiàn)在可以直接對手機(jī)說“掃碼”,一句話喚醒。這個技能適用于各種著急買東西的場景,其中滋味大家不妨自己體會。

另一個很有代表性的場景是在微信里?,F(xiàn)在微信語音似乎已經(jīng)完全取代了電話,但是在茫茫然一片的微信里,想找到合適的人其實還挺難。要經(jīng)歷點開搜索,打字,完成搜索點入對話框,發(fā)起語音,一共四個步驟。而小藝則可以直接說一句“給微信里的某人打電話”來一步完成。

此外,不同應(yīng)用中觸發(fā)小藝,據(jù)說還有不同驚喜。

“尋找賈維斯”簡史

3、可學(xué)習(xí)和可定義

小藝的另一個升級點,在于學(xué)習(xí)用戶語音習(xí)慣和使用習(xí)慣的能力得到了加強(qiáng),同時開啟了自定義組合技能的新模式。

比如我們周五下班坐進(jìn)車?yán)?,這時候其實是有很多事先要用手機(jī)完成的。比如說,打開導(dǎo)航確認(rèn)目的地,放首《今天是個好日子》聽聽,給哥們發(fā)微信約去看球,給老婆發(fā)短信說今天要加班不回家吃飯了……這種做法并不值得提倡。

可以看到的是,這一波操作雖然心情愉快,但是未免復(fù)雜了點。手速慢的人分分鐘就會被晚高峰給追上。而在新版的小藝中,用戶可以自定義這些操作,整合成同一個語音命令。比如說對小藝大吼“勞資下班了!”小藝就會自動進(jìn)行用戶設(shè)定的上述操作,又簡單又解氣。

從小藝的故事可以看到的是,手機(jī)語音助手走到今天,已經(jīng)不僅僅是一個語音軟件本身的智能程度問題,而是整部手機(jī)的能力,都要通過語音助手來集成和調(diào)動。把多種能力、多個應(yīng)用,多個交互進(jìn)行折疊,最終折疊出的才是更省時省力,更符合用戶期待的自然交互。

而從語音助手誕生時的套模板,再到AI的入場,隨后發(fā)展到手機(jī)軟硬一體化的智能折疊時代,語音助手的變遷史中,似乎可以總結(jié)出一個公式。

語音助手的“賈維斯公式”

到底怎么才能做出大家心目中的賈維斯?通過手機(jī)和語音助手的不斷耦合,我們可以發(fā)現(xiàn)這樣幾件事是先覺條件:

1、不斷升級的AI綜合體

從谷歌、微軟、亞馬遜激烈競爭的語音助手,到國內(nèi)的智能音箱熱潮、手機(jī)語音助手不斷升級,而AI能力始終是這個故事的“主線劇情”。

而隨著步入移動AI時代,語音助手現(xiàn)在的任務(wù),從整合AI技術(shù),開始發(fā)展到了整合AI應(yīng)用、AI能力和AI技術(shù)的三合一模式。

回望華為手機(jī)開啟AI進(jìn)化的這兩年,從EMUI在8.0時期開始,諸多智慧能力開始顯現(xiàn)。到 9.0時代,開始加強(qiáng)視覺AI應(yīng)用,并且對AI能力進(jìn)行整合。而到9.1當(dāng)中,語音助手開始整合更多AI應(yīng)用??梢钥闯?,AI的從無到有,從弱到強(qiáng),從分散到整合,是手機(jī)助手進(jìn)化的主線。

“尋找賈維斯”簡史

2、軟硬件不分彼此

在手機(jī)當(dāng)中,一款軟件的能力總歸有限,只有與應(yīng)用、內(nèi)容和硬件層面更好結(jié)合,才能真正讓用戶獲得智能的體驗和實際的應(yīng)用價值。

這就好比只會逗悶子的賈維斯并不招人喜歡,天文地理無所不知,還能操縱鋼鐵俠戰(zhàn)衣的才是“真·賈維斯”。語音助手之所以今天的領(lǐng)軍者變成華為和EMUI,很大程度在于華為手機(jī)這幾年在軟硬件一體化能力上的積極探索,一定程度打破了舊有手機(jī)模式的藩籬。

當(dāng)語音助手可以調(diào)動智慧視覺和各種應(yīng)用,其價值就好像你的朋友突然由員工升級成了老總……

3、基于人性,去折疊每一個交互

要注意的是,語音助手始終伴隨著一條炫技之路:由于AI帶來的技術(shù)非常充沛,開發(fā)者很容易把語音交互搞得復(fù)雜無比。雖然初心是讓消費者感受到技術(shù)爆發(fā)的魅力,但實際應(yīng)用中消費者往往不勝其擾,只能敬而遠(yuǎn)之。

所以在語音助手的進(jìn)化中,需要基于人性化的產(chǎn)品思考,基于用戶感受去折疊和省略交互。只要技術(shù)復(fù)雜同時交互簡單,語音助手才有親和力可言。

至此,不難發(fā)現(xiàn),這條尋找賈維斯之路,似乎可以被總結(jié)成這樣的公式:智能技術(shù)更復(fù)雜,產(chǎn)品融合度更強(qiáng),交互更人性=語音助手更像賈維斯。

并且我們有理由相信,所有尋找終歸能夠抵達(dá)終點。

當(dāng)前題目:“尋找賈維斯”簡史-創(chuàng)新互聯(lián)
分享鏈接:http://muchs.cn/article44/djidhe.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站網(wǎng)站設(shè)計、定制開發(fā)、品牌網(wǎng)站制作自適應(yīng)網(wǎng)站、小程序開發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)公司