視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用

視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用

ID:7824773

大?。?5.05 KB

頁(yè)數(shù):3頁(yè)

時(shí)間:2018-02-27

視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用_第1頁(yè)
視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用_第2頁(yè)
視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用_第3頁(yè)
資源描述:

《視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用計(jì)科110111281004郭珣摘要:人機(jī)交互技術(shù)是指通過(guò)計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù)?,F(xiàn)在多數(shù)軟件的交互設(shè)備還限制在鼠標(biāo)、鍵盤、觸摸屏、顯示器等基本的輸入輸出設(shè)備上,為了是用戶更加方便快捷地進(jìn)行操作.在這里,主要講述三種感官在人機(jī)交互中的運(yùn)用,如何借助計(jì)算機(jī)模擬的視覺(jué)聽(tīng)覺(jué)觸覺(jué)能力來(lái)實(shí)現(xiàn)更加方便高效的人機(jī)交互.關(guān)鍵詞:人機(jī)交互交互設(shè)備計(jì)算機(jī)視覺(jué)聽(tīng)覺(jué)觸覺(jué)人機(jī)交互界面,是系統(tǒng)面向用戶的部分,用戶通過(guò)人機(jī)交互界面與系統(tǒng)交流,是計(jì)算機(jī)系統(tǒng)向用戶提供的綜

2、合操作環(huán)境,是計(jì)算機(jī)系統(tǒng)的重要組成部分。而自適應(yīng)人機(jī)界面的設(shè)計(jì)基于這樣的假設(shè),即計(jì)算機(jī)系統(tǒng)能夠通過(guò)評(píng)價(jià)用戶的操作行為及環(huán)境狀態(tài),使自己適合用戶的期望和任務(wù)要求,從而打破計(jì)算機(jī)和用戶之間的通訊障礙。1.視覺(jué)在人機(jī)交互中的應(yīng)用??在人們的交談和彼此間的交互過(guò)程中,視覺(jué)信息顯然是很重要的。通過(guò)視覺(jué)的模態(tài),我們可以立即確定許多顯著的關(guān)于他人的事實(shí)和特征,包括他們的位置、身份、大致的年齡、注意力的焦點(diǎn)、臉部表情、姿勢(shì)、手勢(shì)和一般的活動(dòng)。這些視覺(jué)線索影響到了會(huì)話的內(nèi)容和進(jìn)程,并提供了一些上下文相關(guān)的信息,這些信息與

3、言語(yǔ)不同,但與此相關(guān),例如,一個(gè)手勢(shì)或面部表情可能是一個(gè)關(guān)鍵的信號(hào),一個(gè)注視的角度可能可以消除在言語(yǔ)中“這個(gè)”或者“在那邊”的指帶不明。換言之,在人與人的交互中,視覺(jué)和言語(yǔ)是聯(lián)合表達(dá),相互補(bǔ)充的通道。正如語(yǔ)音自動(dòng)識(shí)別是試圖構(gòu)造能夠感知人們交流的文字方面的機(jī)器,那么計(jì)算機(jī)視覺(jué)技術(shù)是用來(lái)構(gòu)造能夠“觀察人”并自動(dòng)感知相關(guān)視覺(jué)信息的機(jī)器。由上,計(jì)算機(jī)視覺(jué)技術(shù)顯得尤為重要,計(jì)算機(jī)視覺(jué)是一門試圖通過(guò)圖像處理或視頻處理而使計(jì)算機(jī)具備“看”的能力的計(jì)算學(xué)科。通過(guò)理解圖像形成的幾何和輻射線測(cè)定,接受器(相機(jī))的屬性和物理

4、世界的屬性,就有可能(至少在某些情況下)從圖像中推斷出關(guān)于事物的有用信息,例如一塊織物的顏色、一圈染了色的痕跡的寬度、火星上一個(gè)移動(dòng)機(jī)器人面前的障礙物的大小、監(jiān)防系統(tǒng)中一張人臉的身份、海底植物的類型或者是MRI掃描圖中的腫瘤位置。計(jì)算機(jī)視覺(jué)研究的就是如何能健壯、有效地完成這類的任務(wù)。最初計(jì)算機(jī)視覺(jué)被看作是人工智能的一個(gè)子方向,現(xiàn)在已成為一個(gè)活躍的研究領(lǐng)域并長(zhǎng)達(dá)40年了。但經(jīng)過(guò)我查閱資料,我認(rèn)為計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展相對(duì)于語(yǔ)音技術(shù)而言,仍舊比較原始,語(yǔ)音技術(shù)已經(jīng)做到了成熟的商業(yè)化推廣,發(fā)展了幾十年.因此,在

5、計(jì)算機(jī)視覺(jué)技術(shù)方面,仍然有大有作為的地方.2.聽(tīng)覺(jué)在人機(jī)交互中的應(yīng)用對(duì)于計(jì)算機(jī)聽(tīng)覺(jué),也就是語(yǔ)音識(shí)別技術(shù),相對(duì)于計(jì)算機(jī)視覺(jué)而言,聽(tīng)覺(jué)技術(shù)的發(fā)展成就比較突出,發(fā)展也更為成熟.目前在大詞匯語(yǔ)音識(shí)別方面處于領(lǐng)先地位的IBM語(yǔ)音研究小組,就是在70年代開(kāi)始了它的大詞匯語(yǔ)音識(shí)別研究工作的。AT&T的貝爾研究所也開(kāi)始了一系列有關(guān)非特定人語(yǔ)音識(shí)別的實(shí)驗(yàn)。這一研究歷經(jīng)10年,其成果是確立了如何制作用于非特定人語(yǔ)音識(shí)別的標(biāo)準(zhǔn)模板的方法。這一時(shí)期所取得的重大進(jìn)展有:(1).隱式馬爾科夫模型(HMM)技術(shù)的成熟和不斷完善成為語(yǔ)

6、音識(shí)別的主流方法。(2).以知識(shí)為基礎(chǔ)的語(yǔ)音識(shí)別的研究日益受到重視。在進(jìn)行連續(xù)語(yǔ)音識(shí)別的時(shí)候,除了識(shí)別聲學(xué)信息外,更多地利用各種語(yǔ)言知識(shí),諸如構(gòu)詞、句法、語(yǔ)義、對(duì)話背景方面等的知識(shí)來(lái)幫助進(jìn)一步對(duì)語(yǔ)音作出識(shí)別和理解。同時(shí)在語(yǔ)音識(shí)別研究領(lǐng)域,還產(chǎn)生了基于統(tǒng)計(jì)概率的語(yǔ)言模型。(3).人工神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別中的應(yīng)用研究的興起。在這些研究中,大部分采用基于反向傳播算法(BP算法)的多層感知網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)具有區(qū)分復(fù)雜的分類邊界的能力,顯然它十分有助于模式劃分。特別是在電話語(yǔ)音識(shí)別方面,由于其有著廣泛的應(yīng)用前景,

7、成了當(dāng)前語(yǔ)音識(shí)別應(yīng)用的一個(gè)熱點(diǎn)。另外,面向個(gè)人用途的連續(xù)語(yǔ)音聽(tīng)寫機(jī)技術(shù)也日趨完善。這方面,最具代表性的是IBM的ViaVoice和Dragon公司的DragonDictate系統(tǒng)。這些系統(tǒng)具有說(shuō)話人自適應(yīng)能力,新用戶不需要對(duì)全部詞匯進(jìn)行訓(xùn)練,便可在使用中不斷提高識(shí)別率。中國(guó)的語(yǔ)音識(shí)別技術(shù)的發(fā)展: ⑴在北京有中科院聲學(xué)所、自動(dòng)化所、清華大學(xué)、北京交通大學(xué)等科研機(jī)構(gòu)和高等院校。另外,還有哈爾濱工業(yè)大學(xué)、中國(guó)科技大學(xué)、四川大學(xué)等也紛紛行動(dòng)起來(lái)??偠灾?我校在計(jì)算機(jī)語(yǔ)音研究方面,在國(guó)內(nèi)占有一定地位,語(yǔ)音技術(shù)是

8、一個(gè)相對(duì)成熟的技術(shù),目前該技術(shù)發(fā)展仍然很快速,近幾年有如下進(jìn)展,特別是2009年以來(lái),借助機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究的發(fā)展,以及大數(shù)據(jù)語(yǔ)料的積累,語(yǔ)音識(shí)別技術(shù)得到突飛猛進(jìn)的發(fā)展。重大進(jìn)展:1)將機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究引入到語(yǔ)音識(shí)別聲學(xué)模型訓(xùn)練,使用帶RBM預(yù)訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò),極大提高了聲學(xué)模型的準(zhǔn)確率。在此方面,微軟公司的研究人員率先取得了突破性進(jìn)展,他們使用深層神經(jīng)網(wǎng)絡(luò)模型(DNN)后,語(yǔ)音識(shí)別錯(cuò)誤率降低了30%,是近20年來(lái)語(yǔ)音識(shí)別技

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。