LZ77壓縮算法原理的理解
10年積累的做網(wǎng)站、網(wǎng)站設(shè)計經(jīng)驗,可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識你,你也不認(rèn)識我。但先網(wǎng)站設(shè)計制作后付款的網(wǎng)站建設(shè)流程,更有杜集免費網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。數(shù)據(jù)壓縮是一個減小數(shù)據(jù)存儲空間的過程,目前被應(yīng)用在軟件工程的各個地方,了解其一些原理,方便我們更好的甄選壓縮方案。
壓縮方案有很多種,常見的就是有損和無損壓縮。霍夫曼編碼和LZ77(Lempel-Ziv-1977)都是無損壓縮,其中霍夫曼是采用最小冗余編碼的算法進(jìn)行壓縮,而LZ77是采用字典的方式進(jìn)行壓縮。關(guān)于霍夫曼編碼的算法,網(wǎng)上有很多對其詳細(xì)的講解,我們本篇幅不在細(xì)說,主要圖解一下LZ77壓縮算法的方式,看看其有哪些優(yōu)缺點。
信息熵
數(shù)據(jù)為何是可以壓縮的,因為數(shù)據(jù)都會表現(xiàn)出一定的特性,稱為熵。絕大多數(shù)的數(shù)據(jù)所表現(xiàn)出來的容量往往大于其熵所建議的最佳容量。比如所有的數(shù)據(jù)都會有一定的冗余性,我們可以把冗余的數(shù)據(jù)采用更少的位對頻繁出現(xiàn)的字符進(jìn)行標(biāo)記,也可以基于數(shù)據(jù)的一些特性基于字典編碼,代替重復(fù)多余的短語。
LZ77算法原理
LZ77壓縮算法采用字典的方式進(jìn)行壓縮,是一個簡單但十分高效的數(shù)據(jù)壓縮算法。其方式就是把數(shù)據(jù)中一些可以組織成短語(最長字符)的字符加入字典,然后再有相同字符出現(xiàn)采用標(biāo)記來代替字典中的短語,如此通過標(biāo)記代替多數(shù)重復(fù)出現(xiàn)的方式以進(jìn)行壓縮。要理解這種算法,我們先了解3個關(guān)鍵詞:短語字典,滑動窗口和向前緩沖區(qū)。
關(guān)鍵詞:
1.前向緩沖區(qū)
每次讀取數(shù)據(jù)的時候,先把一部分?jǐn)?shù)據(jù)預(yù)載入前向緩沖區(qū)。為移入滑動窗口做準(zhǔn)備
2.滑動窗口
一旦數(shù)據(jù)通過緩沖區(qū),那么它將移動到滑動窗口中,并變成字典的一部分。
3.短語字典
從字符序列S1...Sn,組成n個短語。比如字符(A,B,D) ,可以組合的短語為{(A),(A,B),(A,B,D),(B),(B,D),(D)},如果這些字符在滑動窗口里面,就可以記為當(dāng)前的短語字典,因為滑動窗口不斷的向前滑動,所以短語字典也是不斷的變化。
LZ77的主要算法邏輯就是,先通過前向緩沖區(qū)預(yù)讀數(shù)據(jù),然后再向滑動窗口移入(滑動窗口有一定的長度),不斷的尋找能與字典中短語匹配的最長短語,然后通過標(biāo)記符標(biāo)記。我們還以字符ABD為例子,看如下圖:
目前從前向緩沖區(qū)中可以和滑動窗口中可以匹配的最長短語就是(A,B),然后向前移動的時候再次遇到(A,B)的時候采用標(biāo)記符代替。
壓縮
當(dāng)壓縮數(shù)據(jù)的時候,前向緩沖區(qū)與移動窗口之間在做短語匹配的是后會存在2種情況:
一旦把n個符號編碼并生成響應(yīng)的標(biāo)記,就將這n個符號從滑動窗口的一端移出,并用前向緩沖區(qū)中同樣數(shù)量的符號來代替它們,如此,滑動窗口中始終有最新的短語。
我們采用圖例來看:
1、開始
2、滑動窗口中沒有數(shù)據(jù),所以沒有匹配到短語,將字符A標(biāo)記為A
3、滑動窗口中有A,沒有從緩沖區(qū)中字符(BABC)中匹配到短語,依然把B標(biāo)記為B
4、緩沖區(qū)字符(ABCB)在滑動窗口的位移6位置找到AB,成功匹配到短語AB,將AB編碼為(6,2,C)
5、緩沖區(qū)字符(BABA)在滑動窗口位移4的位置匹配到短語BAB,將BAB編碼為(4,3,A)
6、緩沖區(qū)字符(BCAD)在滑動窗口位移2的位置匹配到短語BC,將BC編碼為(2,2,A)
7、緩沖區(qū)字符D,在滑動窗口中沒有找到匹配短語,標(biāo)記為D
8、緩沖區(qū)中沒有數(shù)據(jù)進(jìn)入了,結(jié)束
解壓
解壓類似于壓縮的逆向過程,通過解碼標(biāo)記和保持滑動窗口中的符號來更新解壓數(shù)據(jù)。
當(dāng)解碼字符標(biāo)記:將標(biāo)記編碼成字符拷貝到滑動窗口中
解碼短語標(biāo)記:在滑動窗口中查找響應(yīng)偏移量,同時找到指定長短的短語進(jìn)行替換。
我們還是采用圖例來看下:
1、開始
2、符號標(biāo)記A解碼
3、符號標(biāo)記B解碼
4、短語標(biāo)記(6,2,C)解碼
5、短語標(biāo)記(4,3,A)解碼
6、短語標(biāo)記(2,2,A)解碼
7、符號標(biāo)記D解碼
優(yōu)缺點
大多數(shù)情況下LZ77壓縮算法的壓縮比相當(dāng)高,當(dāng)然了也和你選擇滑動窗口大小,以及前向緩沖區(qū)大小,以及數(shù)據(jù)熵有關(guān)系。其壓縮過程是比較耗時的,因為要花費很多時間尋找滑動窗口中的短語匹配,不過解壓過程會很快,因為每個標(biāo)記都明確告知在哪個位置可以讀取了。
以上就是LZ77壓縮算法原理的理解,如有疑問請留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)建站muchs.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
分享題目:LZ77壓縮算法原理的理解-創(chuàng)新互聯(lián)
分享地址:http://muchs.cn/article22/dgcsjc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站制作、響應(yīng)式網(wǎng)站、企業(yè)網(wǎng)站制作、用戶體驗、商城網(wǎng)站、服務(wù)器托管
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容