數(shù)字標(biāo)牌網(wǎng) 服務(wù)熱線:400-6787-360 | 投稿郵箱 | 會員登錄 | 免費注冊 | 設(shè)為首頁 | 加入收藏 | RSS | 客戶服務(wù) | 月刊訂閱 | |||
|
![]() |
Zoe生成的虛擬頭像能夠展現(xiàn)高興、憤怒、恐懼等六種人類表情,更重要的是她還能夠表達出對應(yīng)的語音語調(diào)。
Zoe像是一個虛擬的人造人,沒有實際的肉體,僅存活在屏幕之內(nèi),卻能使用不同的面部表情和語音語調(diào)來表達人類的所有情感。未來,她可能會淘汰目前以文本和音頻為主的信息溝通模式,或是成為我們手機之內(nèi)的“人造人助手”。
這套系統(tǒng)由東芝劍橋?qū)嶒炇?Toshiba’s Cambridge Research Lab)聯(lián)合劍橋大學(xué)工程系打造,締造者將其命名為“Zoe”。當(dāng)你看到Zoe的談吐,肯定會被這種極其科幻的產(chǎn)品模糊了現(xiàn)實感。
Zoe生成的虛擬頭像能夠展現(xiàn)高興、憤怒、恐懼等六種人類表情,更關(guān)鍵的是她還能夠表達出對應(yīng)的語音語調(diào)。作為操作者,你只需輸入文本,再選擇需要的表情,屏幕內(nèi)的人造人便會按要求,咆哮或是溫婉地說出這段文字。設(shè)計者表示,這是人類有史以來制造出的最寫實、最能復(fù)刻人類行為的虛擬形象。
Zoe的面容來自一位真實的演員佐伊·李斯特(Zoe Lister),她在《圣橡鎮(zhèn)少年傳奇》(Hollyoaks)內(nèi)扮演佐伊·卡朋特(Zoe Carpenter)的角色,選擇她的原因,大概是因為系統(tǒng)設(shè)計者是這位演員的超級粉絲。為了創(chuàng)造該系統(tǒng),設(shè)計者們花了數(shù)日的時間才全面采集了佐伊的表情與談吐,并通過Zoe系統(tǒng)復(fù)制了這么一個虛擬人臉。
關(guān)于Zoe的應(yīng)用前景,它很有可能開辟全新的短信模式。比如你發(fā)送一條短信“我可能要遲到了”給朋友,同時選擇沮喪的表情,對方便會收到一張人臉,垂頭喪氣地說“我要遲到了”。就目前而言,Zoe的開發(fā)團隊還將它應(yīng)用在特殊兒童學(xué)校,輔孤獨癥以及聽力障礙的兒童學(xué)習(xí)。通過Zoe,這些兒童可以明白不同情緒與文字間的對應(yīng)關(guān)系,還能夠便捷地學(xué)習(xí)唇語。當(dāng)然,Zeo的應(yīng)用空間十分寬廣,電子游戲、有聲讀物等領(lǐng)域都能夠采納這種全新的用戶界面。
“這個系統(tǒng)將開辟新一代的用戶界面,人機交互將變得像人與人溝通一樣簡單自然。”劍橋大學(xué)工程系教授羅伯托·西珀拉(Roberto Cipolla)表達了自己的看法,“我們花了好幾天時間才建成第一個虛擬形象,是因為我們要從零開始教會系統(tǒng)如何理解語言和表情。當(dāng)這一道工序完成后,后來者要更改虛擬形象的顏貌和聲音就要簡單得多了。”
也就是說,如果你不喜歡這位女演員,Zoe系統(tǒng)內(nèi)的架構(gòu)完全支持你將這張人臉換成任何人。與設(shè)計初始的艱辛相異,后來者只要花幾秒鐘上傳自己的聲音與頭像即可。這樣一來,這套系統(tǒng)就具備了相當(dāng)高的開放性,每個人都可以拿它定制自己喜愛的虛擬形象。
別看Zoe功能如此強大,它卻是一個相當(dāng)輕簡的系統(tǒng),只有十幾兆大小。系統(tǒng)輕簡的最大好處是,它能夠被安裝在小型計算機設(shè)備上,包括手機、平板,亦或是未來有可能出現(xiàn)的各種便攜式智能設(shè)備。
Zoe的情感生成功能來自于一個類似于雷達圖的“性格生成儀表盤”,上面有高興、悲傷、溫柔、憤怒、恐懼與呆板六個屬性,你可以輕而易舉地通過拉條選取不同分量的不同屬性,搭配出自己想要的任意表情。同時,話語的音高、語速、語調(diào)等基本屬性也都是可調(diào)的。
比方說,你拉取了一定的“開心”和“溫柔”屬性,并且適當(dāng)?shù)靥岣哒Z速和語調(diào)的深沉,這句話表現(xiàn)出來就是友好而熱情的歡迎。假設(shè)你拉取了一定的“憤怒”和“恐懼”屬性,并適當(dāng)?shù)靥岣哒Z速,這句話表現(xiàn)出來就有些恐慌。從理論上說,你可以為在Zoe內(nèi)復(fù)刻所有的人類情感,這種系統(tǒng)的確是前所未有的。
在制作Zoe時,為了讓虛擬人像的表現(xiàn)盡可能逼真,設(shè)計團隊收集了數(shù)千個語句的數(shù)據(jù),并且邀請佐伊·李斯特本人幫助他們的工作。設(shè)計團隊通過計算機視覺軟件記錄佐伊說話時的表情,再將一切信息制作成數(shù)據(jù)庫。通過特定的算法,Zoe能夠知道應(yīng)該在什么時候調(diào)取哪一種圖像及聲音模塊。
為測試Zoe的表現(xiàn)是否達到了他們預(yù)設(shè)的目標(biāo),設(shè)計團隊通過眾包平臺找來了200位志愿者。每位志愿者都被發(fā)放了一段視頻和一段音頻,20人為一組,每組收到的視頻及音頻分別對應(yīng)不同的語句。志愿者被要求在觀看視頻(沒有聲音)、收聽音頻(沒有視頻)、觀看帶有音頻的視頻后分別給出自己的判斷,判斷音/視頻所要表達的情感都是6中情感屬性中的哪一種。
結(jié)果顯示,只看視頻、不聽聲音的志愿者判斷正確的概率為52%;只聽聲音、不看視頻的志愿者判斷正確的概率為 68%;如果志愿者即觀看視頻又收聽音頻,正確率可以達到77%。也許你覺得這個數(shù)字并不高,但事實上,在志愿者觀看佐伊本人說話時,判斷情感正確的概率只有73%!這大概是因為合成的頭像在表達情況時更為模式化,也更夸張。
Zoe設(shè)計團隊目前的主要任務(wù)有兩點,首先是進一步開辟Zoe的應(yīng)用空間,其次是進一步完善Zoe的用戶自定義功能。“就目前而言,人類和計算機的交互依舊停留在鍵盤輸入、鼠標(biāo)點擊之上,”西珀拉教授表示,“這種模式對于很多人而言是極度不便的。如果我們在未來能夠讓人類通過更為自然的方式與計算機進行交互,就好比語言和動作,計算機的普及程度肯定會大為提升。這就是我們創(chuàng)造Zoe的目的,創(chuàng)造一個更具表達能力的,能夠情感互動的計算機形象,創(chuàng)造一種最自然的交互體驗。”
![]() |
戶外廣告機 |
落地式廣告機 |
高清廣告機 |
分屏廣告機 |
藍(lán)牙廣告機 |
網(wǎng)絡(luò)廣告機 |
數(shù)字標(biāo)牌播放器 |
廣告機方案 |
多媒體信息發(fā)布系統(tǒng) |
觸控一體機 |
高清機頂盒 鏡面廣告機 | 多媒體廣告機 | 觸摸廣告機 | 網(wǎng)絡(luò)廣告機 | 液晶廣告機 | 車載廣告機 | 互動式廣告載體 | 樓宇廣告機 | 流媒體實時發(fā)布系統(tǒng) | 廣告機外殼 | 戶外大屏幕 廣告機報價 | 數(shù)字標(biāo)牌軟件 | 電子看板 | 商業(yè)顯示 | 嵌入式主板 | 觸控一體機 | 數(shù)字標(biāo)牌顯示器 | 嵌入式流媒體服務(wù)器 立式廣告機 | |