資源描述:
《多媒體技術(shù)的發(fā)展及前景展望》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、多媒體技術(shù)的發(fā)展與應用前景多媒體技術(shù)是當今信息技術(shù)領域發(fā)展最快、最活躍的技術(shù),是新一代電子技術(shù)發(fā)展和競爭的焦點。它的出現(xiàn)使得我們的計算機世界豐富多彩起來,也使得計算機世界充滿了人性的氣息。多媒體技術(shù)從問世起即引起人們的廣泛關(guān)注,并迅速由科學研究走向應用、走向市場,其應用領域遍及人類社會的各個方面。多媒體技術(shù)的產(chǎn)生和發(fā)展,是技術(shù)和應用發(fā)展的必然。在信息社會,人們迫切希望計算機能以人類習慣的方式提供信息服務,因而多媒體技術(shù)應運而生。隨著日益普及的高速信息網(wǎng)發(fā)展,它正被廣泛應在我們的日常生活、咨詢服務、教育、通信、醫(yī)療等諸多行業(yè)。多媒體包括文本、圖形、靜態(tài)圖像、聲音
2、、動畫、視頻剪輯等基本要素。在進行多媒體教學課件設計的,也就是從這些要素的作用、特性出發(fā),在教育學、心理學等原理的指導下,充分構(gòu)思、組織多媒體要素,發(fā)揮各種媒體要素的長處,為不同學習類型的學習者提供不同的學習媒體信息,從多種媒體渠道向?qū)W習者傳遞教育、教學信息。多媒體技術(shù)是20世紀90年代發(fā)展起來的新技術(shù),是一種把文本、圖形、視頻、動畫和聲音等運載信息的媒體集成在一起,并通過計算機綜合處理和控制的一種信息技術(shù)。它實質(zhì)上是綜合了計算機、圖形學、圖像處理、影視藝術(shù)、音樂美術(shù)、教育學、心理學、人工智能、信息學、電子技術(shù)學等眾多學科與技術(shù)的一門技術(shù),它集文字、圖形、圖像
3、、聲音、二維三維動畫等各種信息于一體,能充分調(diào)動視覺和聽覺處理功能。1多媒體系統(tǒng)的關(guān)鍵技術(shù)1.1音頻信息處理的應用在多媒體技術(shù)中,存儲聲音信息的文件格式主要是:VOC文件、WAV文件、AIF文件、MIDI文件、SON文件及RMI文件等。(1)音頻信息錄制編輯把音樂和語音加到多媒體應用中,是我們研究音頻處理技術(shù)的目的,下面是常用的音頻信息錄制編輯軟件。WaveEdit工具的REC命令;SoundBlaster卡的VEdit2軟件;MicrosoftSoundSystem卡的QuickRecorder軟件;Cooledit軟件;WaveEdit工具;Creativ
4、eWaveStudio。(2)語音識別計算機通過語音識別系統(tǒng),將用戶所輸入的語音轉(zhuǎn)換成電子文本的能力,就是所謂的語音識別。語音識別涉及語言學、計算機科學及信號處理等領域,甚至還涉及人的體態(tài)語言(人在說話時的表情、手勢等可幫助對方理解的行為動作),其最終目標是實現(xiàn)人與機器進行自然語言交流。20世紀90年代,AT&T公司研發(fā)出用于自動話務員呼叫的VRCP系統(tǒng)。AT&T800語音識別系統(tǒng)、NTTANSWER語音識別銀行服務系統(tǒng)等都是目前比較流行的語音識別系統(tǒng)。隨著多媒體時代的到來,眾多著名公司(IBM、Microsoft、Apple、Philips、L&H、Spee
5、chworks、Nuance、Infotalk等)及一些發(fā)達國家(諸如美國、日本、韓國等)都為語音識別系統(tǒng)的研發(fā)和成果轉(zhuǎn)化投入巨資,語音識別技術(shù)日漸成熟?,F(xiàn)在,語音識別系統(tǒng)已經(jīng)走出實驗室,IBM和微軟公司都已推出了比較成熟的語音識別系統(tǒng)。(3)文語轉(zhuǎn)換世界上已研制出漢、英、日、法、德等語種的文語轉(zhuǎn)換系統(tǒng),并在許多領域得到了廣泛應用。DECTalk文語轉(zhuǎn)換系統(tǒng):這是DEC公司在MIT的KLATT教授研制的語音合成器的基礎上開發(fā)的語音生成系統(tǒng),用于英語文語轉(zhuǎn)換。AT&TBell文語轉(zhuǎn)換系統(tǒng):這是美國AT&T貝爾實驗室研制的文語轉(zhuǎn)換系統(tǒng),它最初用于英語的文語轉(zhuǎn)換,現(xiàn)
6、在正擴展到其它語種。1.2數(shù)據(jù)庫和基于內(nèi)容檢索的應用隨著多媒體技術(shù)的迅速普及,Web上將大量出現(xiàn)多媒體信息,例如,在遙感、醫(yī)療、安全、商業(yè)等部門中每天都不斷產(chǎn)生大量的圖像信息。這些信息的有效組織管理和檢索中都依賴基于圖像內(nèi)容的檢索。目前,這方面的研究已引起了廣泛的重視,并已有一些提供圖像檢索功能的多媒體檢索系統(tǒng)軟件問世。例如,由IBM公司開發(fā)的QBIC是最有代表性的系統(tǒng),它通過友好的圖形界面為用戶提供了顏色、紋理、草圖、形狀等多種檢索方法;美國加州大學伯克利分校與加州水資源部合作進行了Chabot計劃,以便對水資源部的大量圖像提供基于內(nèi)容的有效檢索手段。此外還
7、有麻省理工學院的Photobook,可以利用Face,Shape,Texture,Photobook分別對人臉圖像、工具和紋理進行基于內(nèi)容的檢索,在Virage系統(tǒng)中又進一步發(fā)展了將多種檢索特征相融合的手段。澳大利亞的NewSouthWales大學已開發(fā)了NUTTAB系統(tǒng),用于食品成份數(shù)據(jù)庫的檢索。1.3流媒體技術(shù)的應用流媒體采用流式傳輸視頻信息的方式,實現(xiàn)在線視頻播放。顧名思義,視頻信息就像水流一樣連續(xù)到達用戶端,從而形成“邊傳邊播”的流式視頻。簡單地說,流媒體技術(shù)就是將網(wǎng)上連續(xù)的影像、聲音,邊下載邊播放,不必等整個文件下載完畢才能觀看影視節(jié)目?!斑厒鬟叢ァ?/p>
8、的視頻觀看方式避免了從網(wǎng)上下載整個文件