2021-02-10 分類: 網(wǎng)站建設(shè)
目前機(jī)器智能領(lǐng)域的成功主要依賴于計(jì)算能力,為了做出好決策可能搜索數(shù)十億次。如果決策成功的話,往往表明計(jì)算能力已經(jīng)趕上甚至超過(guò)人類的智力。人類智能是高度概括的、自適應(yīng)的和健壯的,即使當(dāng)前先進(jìn)的機(jī)器智能系統(tǒng)也無(wú)法產(chǎn)生這些特性。例如,即使存在許多未知的變量,人類也能夠根據(jù)預(yù)期的結(jié)果提前進(jìn)行重要的計(jì)劃。人類的智慧還具有同情心、同理心、善良、有教養(yǎng),而且重要的是,它能夠?yàn)榱烁蟮氖姑艞壓椭匦露x一些目標(biāo)。幾乎所有的機(jī)器智能研究都集中在“如何”上,但人類智能的特點(diǎn)是能夠問(wèn)“什么”和“為什么”。
假設(shè)情商是開(kāi)啟智能機(jī)器的關(guān)鍵,他們不僅更普遍、更強(qiáng)大、更高效,而且還符合人類的價(jià)值觀。人類的情感機(jī)制使我們能夠完成目前機(jī)器無(wú)法編程或訓(xùn)練的任務(wù)。例如,我們的交感神經(jīng)和副交感神經(jīng)反應(yīng)使我們知道安全,并能意識(shí)到危險(xiǎn)。我們能夠感受到他人的影響,并能設(shè)身處地的去想,這有助于我們做出正確的決定和駕馭復(fù)雜關(guān)系。饑餓、好奇、驚喜和快樂(lè)等情感因素使我們能夠規(guī)范自己的行為,并確定希望實(shí)現(xiàn)的目標(biāo)集。最重要的能力是,我們能夠通過(guò)與他人溝通表達(dá)內(nèi)心狀態(tài),并可能影響他們的決策。
因此,有人假設(shè)將這種情商構(gòu)建到一個(gè)計(jì)算框架中,它至少需要具備以下能力:
從研究歷史上看,構(gòu)建高情商機(jī)器主要從人機(jī)協(xié)作的角度出發(fā),集中在前三項(xiàng)功能上。例如,最早關(guān)于情感識(shí)別的研究始于近30年前,當(dāng)時(shí)人們使用生理傳感器、照相機(jī)、麥克風(fēng)等來(lái)檢測(cè)一系列情感反應(yīng)。雖然人們對(duì)于是否一致和在臉上或其他感官上傳達(dá)信號(hào),以及這些信號(hào)是否真實(shí)反映了他們內(nèi)心的感受,存在著很多爭(zhēng)論,但研究人員已經(jīng)成功地建立了算法來(lái)識(shí)別人類表達(dá)的信號(hào),并證明這些信號(hào)符合社會(huì)文化規(guī)范。
根據(jù)人的內(nèi)在認(rèn)知狀態(tài)采取適當(dāng)行動(dòng)的能力,是具有情商的基本體現(xiàn)。最近在順序決策方面的研究,如上下文賭博機(jī),正逐步取得進(jìn)展。例如,飲食情感管理系統(tǒng)如何幫助人們做出正確的決定。
幾十年來(lái),情感表達(dá)一直處于計(jì)算的最前沿。即使是簡(jiǎn)單的信號(hào)(例如,光、色、聲)也有能力傳達(dá)和激起豐富的情感。在將于2019年第七屆國(guó)際學(xué)習(xí)代表大會(huì)iclr上發(fā)表的“Neural TTS Stylization with Adversarial and Collaborative Games”論文中,我們提出了一種新的機(jī)器學(xué)習(xí)方法來(lái)合成具有表現(xiàn)力的逼真的人類語(yǔ)音。該體系結(jié)構(gòu)模型生成真實(shí)的語(yǔ)音,并通過(guò)一個(gè)易于控制的撥盤(pán),以獨(dú)特的方式改變表達(dá)的情感。我們的模型在多個(gè)任務(wù)中達(dá)到了預(yù)期效果,包括內(nèi)容轉(zhuǎn)換、情感建模和身份轉(zhuǎn)換。本文提供了一個(gè)開(kāi)源實(shí)現(xiàn)。
圖1神經(jīng)模型架構(gòu)
雖然人工智能系統(tǒng)的識(shí)別、表達(dá)和干預(yù)方面的研究在過(guò)去20年已經(jīng)深入,但還有一種更引人注目的智能形式——有效地利用情感機(jī)制的系統(tǒng)——為了更好地學(xué)習(xí)和更有效地做出選擇。我們希望探索建立這樣的情感機(jī)制,以幫助計(jì)算機(jī)實(shí)現(xiàn)比目前更多的決策。
最近人工智能在圍棋、Pac-Man和基于場(chǎng)景的角色扮演游戲等方面取得了成功,很大程度上依賴于強(qiáng)化學(xué)習(xí)。在強(qiáng)化學(xué)習(xí)中,好的行為會(huì)得到獎(jiǎng)勵(lì),壞的行為會(huì)受到懲罰。然而,要讓計(jì)算模型學(xué)習(xí)一個(gè)合理的策略,需要在這樣一個(gè)行動(dòng)獎(jiǎng)勵(lì)框架中進(jìn)行大量的試驗(yàn)。我們可以從人類和其他生物情感中獲得靈感——如何利用情感機(jī)制來(lái)更有效地學(xué)習(xí)。
當(dāng)人類學(xué)會(huì)在世界上生存時(shí),身體(神經(jīng)系統(tǒng))的反應(yīng)會(huì)對(duì)行為選擇提供潛在的持續(xù)反饋,例如,當(dāng)接近懸崖邊緣或在拐彎處快速行駛時(shí),會(huì)變得緊張。生理變化和心理反應(yīng)會(huì)保護(hù)自己免受危險(xiǎn)。人類對(duì)危險(xiǎn)情況的預(yù)感是心率加快,血液從四肢分流,汗腺擴(kuò)張。這是身體的“戰(zhàn)斗或逃跑”反應(yīng)。人類已經(jīng)進(jìn)化了數(shù)百萬(wàn)年來(lái)建立這些復(fù)雜的系統(tǒng)。如果機(jī)器有類似的反饋系統(tǒng)呢?
圖2一種新的強(qiáng)化學(xué)習(xí)方法
在《Visceral Machines: Risk-Aversion in Reinforcement Learning with Intrinsic Physiological Rewards》一書(shū)中,我們提出了一種新的強(qiáng)化學(xué)習(xí)方法,它利用了人類“戰(zhàn)斗或逃跑”行為的內(nèi)在獎(jiǎng)勵(lì)功能。
我們的假設(shè)是,這樣的獎(jiǎng)勵(lì)函數(shù)可以規(guī)避強(qiáng)化學(xué)習(xí)環(huán)境中與稀疏和傾斜獎(jiǎng)勵(lì)相關(guān)的挑戰(zhàn),并有助于提高樣本效率。我們?cè)谀M駕駛環(huán)境中進(jìn)行了測(cè)試,結(jié)果表明,該方法可以提高學(xué)習(xí)速度,減少學(xué)習(xí)過(guò)程中的碰撞次數(shù)。我們對(duì)訓(xùn)練自主系統(tǒng)的潛力感到興奮,這種系統(tǒng)能夠模擬以情感方式感受和響應(yīng)刺激的能力。
圖3 人體在駕駛過(guò)程中所記錄的生理反應(yīng)
許多計(jì)算機(jī)科學(xué)家和機(jī)器人專家都渴望打造出類似于凱特(KITT)和R2D2等流行科幻小說(shuō)中令人難忘的機(jī)器人形象。然而構(gòu)建情感計(jì)算機(jī)制,對(duì)我們構(gòu)建健壯、高效和更有遠(yuǎn)見(jiàn)的人工智能,提供了大好時(shí)機(jī)。我們期待這項(xiàng)研究能讓人們重新審視情感在人工智能中的應(yīng)用。
當(dāng)前題目:人工智能正在向具有“高情商”發(fā)展
轉(zhuǎn)載來(lái)源:http://muchs.cn/news9/100159.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、微信公眾號(hào)、服務(wù)器托管、網(wǎng)頁(yè)設(shè)計(jì)公司、網(wǎng)站內(nèi)鏈、網(wǎng)站營(yíng)銷
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容