資源描述:
《利用JAVA API函數(shù)實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、利用JAVAAPI函數(shù)實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮利用JAVAAPI函數(shù)實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮2002年2月本文通過(guò)對(duì)數(shù)據(jù)壓縮算法的簡(jiǎn)要介紹,然后以詳細(xì)的示例演示了利用java.util.zip包實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓,并擴(kuò)展到在網(wǎng)絡(luò)傳輸方面如何應(yīng)用java.util.zip包現(xiàn)數(shù)據(jù)壓縮與解壓綜述許多信息資料都或多或少的包含一些多余的數(shù)據(jù)。通常會(huì)導(dǎo)致在客戶端與服務(wù)器之間,應(yīng)用程序與計(jì)算機(jī)之間極大的數(shù)據(jù)傳輸量。最常見(jiàn)的解決數(shù)據(jù)存儲(chǔ)和信息傳送的方法是安裝額外的存儲(chǔ)設(shè)備和擴(kuò)展現(xiàn)有的通訊能力。這樣做是可以的,但無(wú)疑會(huì)增加組織的運(yùn)作成本。一種有效的解決數(shù)據(jù)存儲(chǔ)與信息傳輸?shù)姆椒ㄊ峭ㄟ^(guò)更有效率的代碼來(lái)存儲(chǔ)數(shù)據(jù)。這篇
2、文章簡(jiǎn)要的介紹了數(shù)據(jù)的壓縮與解壓縮,并展示了用java.util.zip包來(lái)實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮是多么的方便與高效。當(dāng)然用諸如WinZip,gzip,和Java壓縮(或jar)之類的工具也可以實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮,這些工具都是獨(dú)立的應(yīng)用程序。你也可以在JAVA應(yīng)用程序中調(diào)用這些工具,但這并不是最直接的方法,也不是有效的解決方法。尤其是你想更快速地實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮(例如在傳輸數(shù)據(jù)到遠(yuǎn)程機(jī)器之前)。這篇文章包括以下內(nèi)容:·給出一個(gè)關(guān)于數(shù)據(jù)壓縮的簡(jiǎn)單的介紹·描述java.util.zip包·示例如何使用該包實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮·示例如何壓縮串行化的對(duì)象并將其存儲(chǔ)在磁碟上·示例如何通過(guò)數(shù)據(jù)
3、壓縮來(lái)增強(qiáng)"客戶/服務(wù)"應(yīng)用程序的性能數(shù)據(jù)壓縮概述文件中數(shù)據(jù)冗余的最簡(jiǎn)單的類型是"字符的復(fù)制"。讓我們先來(lái)看下面一個(gè)字符串:·JJJJJJAAAAVVVVAAAAAA這個(gè)字符串可以用更簡(jiǎn)潔的方式來(lái)編碼,那就是通過(guò)替換每一個(gè)重復(fù)的字符串為單個(gè)的實(shí)例字符加上記錄重復(fù)次數(shù)的數(shù)字來(lái)表示,上面的字符串可以被編碼為下面的形式:18/18利用JAVAAPI函數(shù)實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮·6J4A4V6A在這里,"6J"意味著6個(gè)字符J,"4A"意味著4個(gè)字符A,以此類推。這種字符串壓縮方式稱為"行程長(zhǎng)度編碼"方式,簡(jiǎn)稱RLE。再舉一個(gè)例子,考慮一下矩形圖像的存儲(chǔ)。一個(gè)單色位圖,可以被存儲(chǔ)為下面這種形式,如圖1所
4、示。圖1:RLE方式下的位圖信息另外一種方式是將圖像存為一個(gè)圖元文件:Rectangle11,3,20,5上面的表示方法是講矩形的起始坐標(biāo)是(11,3),寬度是20,高度是5。上述的矩形圖像可以使用RLE編碼方式壓縮,通過(guò)對(duì)相同位記數(shù)表示如下:0,400,400,101,200,100,101,10,181,10,100,101,10,181,10,100,101,10,181,10,100,101,200,100,40上面第一行是講圖像的第一行由40個(gè)0組成。第三行是講圖像的第三行是由10個(gè)0加上20個(gè)1再加上10個(gè)0組成,其它行以此類推。18/18利用JAVAAPI函數(shù)實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓
5、縮大家注意,RLE方法需要將其表示的文件與編碼文件分開。所以,這種方法不能應(yīng)用于所有的文件。其它的壓縮技術(shù)包括變長(zhǎng)編碼(也被稱為哈夫曼編碼),還有其它的方法。要想了解更詳細(xì)的信息,請(qǐng)參考有關(guān)數(shù)據(jù)和圖像壓縮技術(shù)方面的圖書,一定會(huì)有收獲的。數(shù)據(jù)壓縮有很多益處。不管怎么說(shuō),最主要的好處就是減少存儲(chǔ)方面的需求。同樣的,對(duì)于數(shù)據(jù)通信來(lái)講,壓縮數(shù)據(jù)在媒體中的將導(dǎo)致信息傳輸數(shù)據(jù)的提升。數(shù)據(jù)的壓縮能夠通過(guò)軟件在現(xiàn)有的硬件設(shè)備上實(shí)現(xiàn)或者通過(guò)帶有壓縮技術(shù)的特殊的硬件設(shè)備來(lái)實(shí)現(xiàn)。圖表2顯示了基本的數(shù)據(jù)壓縮結(jié)構(gòu)圖。圖2:數(shù)據(jù)壓縮結(jié)構(gòu)圖ZIPVSGZIP如果你是在Windows系統(tǒng)下工作,你可能會(huì)對(duì)工具WinZip很熟
6、悉,是用來(lái)創(chuàng)建壓縮檔案和解開壓縮檔案的。而在UNIX平臺(tái)上,會(huì)有一些不同,命令tar用來(lái)創(chuàng)建一個(gè)檔案文件(并不壓縮),其它的程序(gzip或compress)用來(lái)創(chuàng)建一個(gè)壓縮檔案。WinZip和PkZip之類的工具同時(shí)扮演著歸檔和壓縮兩個(gè)角色。他們將文件壓縮并將其歸檔。另一方面,gzip并不將文件歸檔。所以,在UNIX平臺(tái)上,命令tar通常用來(lái)創(chuàng)建一個(gè)檔案文件,然后命令gzip來(lái)將檔案文件壓縮。Java.util.zip包Java提供了java.util.zip包用來(lái)兼容ZIP格式的數(shù)據(jù)壓縮。它提供了一系列的類用來(lái)讀取,創(chuàng)建,修改ZIP和GZIP格式的文件。它還提供了工具類來(lái)計(jì)算任意輸入流的數(shù)
7、目,這可以用來(lái)驗(yàn)證輸入數(shù)據(jù)的有效性。該包提供了一個(gè)接口,十四個(gè)類,和兩個(gè)異常處理類,如表1所示。表1:java.util.zip包條目類型描述Checksum接口被類Adler32和CRC32實(shí)現(xiàn)的接口18/18利用JAVAAPI函數(shù)實(shí)現(xiàn)數(shù)據(jù)的壓縮與解壓縮Adler32類使用Alder32算法來(lái)計(jì)算Checksum數(shù)目CheckedInputStream類一個(gè)輸入流,保存著被讀取數(shù)據(jù)的Checks