H.264與AVS視頻標(biāo)準(zhǔn)核心技術(shù)比較-創(chuàng)新互聯(lián)

視頻編碼技術(shù)在過去幾年最重要的發(fā)展之一是由ITU和ISO/IEC的聯(lián)合視頻小組 (JVT)開發(fā)了H.264/MPEG-4 AVC[8]標(biāo)準(zhǔn)。在發(fā)展過程中，業(yè)界為這種新標(biāo)準(zhǔn)取了許多不同的名稱。ITU在1997年開始利用重要的新編碼工具處理H.26L（長(zhǎng)期），結(jié)果令人鼓舞，于是ISO決定聯(lián)手ITU組建JVT并采用一個(gè)通用的標(biāo)準(zhǔn)。因此，大家有時(shí)會(huì)聽到有人將這項(xiàng)標(biāo)準(zhǔn)稱為JVT，盡管它并非正式名稱。ITU在2003年5月批準(zhǔn)了新的H.264標(biāo)準(zhǔn)。ISO在2003年10 月以MPEG-4 Part 10、高級(jí)視頻編碼或AVC的名稱批準(zhǔn)了該標(biāo)準(zhǔn)。

H.264 實(shí)現(xiàn)的改進(jìn)創(chuàng)造了新的市場(chǎng)機(jī)遇
H.264/AVC在壓縮效率方面取得了巨大突破，一般情況下達(dá)到MPEG-2及MPEG-4簡(jiǎn)化類壓縮效率的大約2倍。在JVT進(jìn)行的正式測(cè)試中，H.264在85個(gè)測(cè)試案例中有78％的案例實(shí)現(xiàn)1.5倍以上的編碼效率提高，77％的案例中達(dá)到2倍以上，部分案例甚至高達(dá)4倍。H.264 實(shí)現(xiàn)的改進(jìn)創(chuàng)造了新的市場(chǎng)機(jī)遇，如：600Kbps的VHS品質(zhì)視頻可以通過ADSL線路實(shí)現(xiàn)視頻點(diǎn)播；高清晰電影無需新的激光頭即可適應(yīng)普通 DVD。
H.264標(biāo)準(zhǔn)化時(shí)支持三個(gè)類別：基本類、主類及擴(kuò)展類。后來一項(xiàng)稱為高保真范圍擴(kuò)展 (FRExt)的修訂引入了稱為高級(jí)類的4個(gè)附加類。在初期主要是基本類和主類引起了大家的興趣?；绢惤档土擞?jì)算及系統(tǒng)內(nèi)存需求，而且針對(duì)低時(shí)延進(jìn)行了優(yōu)化。由于B幀的內(nèi)在時(shí)延以及CABAC的計(jì)算復(fù)雜性，因此它不包括這兩者?；绢惙浅＿m合可視電話應(yīng)用以及其他需要低成本實(shí)時(shí)編碼的應(yīng)用。
主類提供的壓縮效率最高，但其要求的處理能力也比基本類高許多，因此使其難以用于低成本實(shí)時(shí)編碼和低時(shí)延應(yīng)用。廣播與內(nèi)容存儲(chǔ)應(yīng)用對(duì)主類最感興趣，它們是為了盡可能以最低的比特率獲得最高的視頻質(zhì)量。
盡管H.264采用與舊標(biāo)準(zhǔn)相同的主要編碼功能，不過它還具有許多與舊標(biāo)準(zhǔn)不同的新功能，它們一起實(shí)現(xiàn)了編碼效率的提高。其主要差別，概述如下：
幀內(nèi)預(yù)測(cè)與編碼：H.264采用空域幀內(nèi)預(yù)測(cè)技術(shù)來預(yù)測(cè)相鄰塊鄰近像素的Intra-MB中的像素。它對(duì)預(yù)測(cè)殘差信號(hào)和預(yù)測(cè)模式進(jìn)行編碼，而不是編碼塊中的實(shí)際像素。這樣可以顯著提高幀內(nèi)編碼效率。
幀間預(yù)測(cè)與編碼：H.264中的幀間編碼采用了舊標(biāo)準(zhǔn)的主要功能，同時(shí)也增加了靈活性及可操作性，包括適用于多種功能的幾種塊大小選項(xiàng)，如：運(yùn)動(dòng)補(bǔ)償、四分之一像素運(yùn)動(dòng)補(bǔ)償、多參考幀、通用 (generalized)雙向預(yù)測(cè)和自適應(yīng)環(huán)路去塊。
可變矢量塊大?。涸试S采用不同塊大小執(zhí)行運(yùn)動(dòng)補(bǔ)償?？梢詾樾≈?(4的塊傳輸單個(gè)運(yùn)動(dòng)矢量，因此在雙向預(yù)測(cè)情況下可以為單個(gè)MB傳輸多達(dá)32個(gè)運(yùn)動(dòng)矢量。另外還支持16(8、8(16、8(8、8(4和4(8的塊大小。降低塊大小可以提高運(yùn)動(dòng)細(xì)節(jié)的處理能力，因而提高主觀質(zhì)量感受，包括消除較大的塊化失真。
四分之一像素運(yùn)動(dòng)估計(jì)：通過允許半像素和四分之一像素運(yùn)動(dòng)矢量分辨率可以改善運(yùn)動(dòng)補(bǔ)償。
多參考幀預(yù)測(cè)：16個(gè)不同的參考幀可以用于幀間編碼，從而可以改善視頻質(zhì)量的主觀感受并提高編碼效率。提供多個(gè)參考幀還有助于提高H.264位流的容錯(cuò)能力。值得注意的是，這種特性會(huì)增加編碼器與×××的內(nèi)存需求，因?yàn)楸仨氃趦?nèi)存中保存多個(gè)參考幀。
自適應(yīng)環(huán)路去塊濾波器：H.264采用一種自適應(yīng)解塊濾波器，它會(huì)在預(yù)測(cè)回路內(nèi)對(duì)水平和垂直區(qū)塊邊緣進(jìn)行處理，用于消除塊預(yù)測(cè)誤差造成的失真。這種濾波通常是基于4(4塊邊界為運(yùn)算基礎(chǔ)，其中邊界各邊的3個(gè)像素可通過4級(jí)濾波器進(jìn)行更新。
整數(shù)變換：采用DCT的早期標(biāo)準(zhǔn)必須為逆變換的固點(diǎn)實(shí)施來定義舍入誤差的容差范圍。編碼器與×××之間的 IDCT 精度失配造成的漂移是質(zhì)量損失的根源。H.264利用整數(shù)4(4空域變換解決了這一問題——這種變換是DCT的近似值。4(4的小區(qū)塊還有助于減少阻塞與振鈴失真。
量化與變換系數(shù)掃描：變換系數(shù)通過標(biāo)量量化方式得到量化，不產(chǎn)生加大的死區(qū)。與之前的標(biāo)準(zhǔn)類似，每個(gè)MB都可選擇不同的量化步長(zhǎng)，不過步長(zhǎng)以大約12.5％的復(fù)合速率增加，而不是固定遞增。同時(shí)，更精細(xì)的量化步長(zhǎng)還可以用于色度成分，尤其是在粗劣量化光度系數(shù)的情況下。
熵編碼：與根據(jù)所涉及的數(shù)據(jù)類型提供多個(gè)靜態(tài)VLC表的先前標(biāo)準(zhǔn)不同，H.264針對(duì)變換系數(shù)采用上下文自適應(yīng)VLC，同時(shí)針對(duì)所有其他符號(hào)采用統(tǒng)一的VLC (UniversalVLC)方法。主類還支持新的上下文自適應(yīng)二進(jìn)制算術(shù)編碼器 (CABAC)。CAVLC優(yōu)于以前的VLC實(shí)施，不過成本卻比VLC高。
CABAC利用編碼器和譯碼器的機(jī)率模型來處理所有語法元素 (syntax elements)，包括：變換系數(shù)和運(yùn)動(dòng)矢量。為了提高算術(shù)編碼的編碼效率，基本概率模型通過一種稱為上下文建模的方法對(duì)視頻幀內(nèi)不斷變換的統(tǒng)計(jì)進(jìn)行適應(yīng)。上下文建模分析提供編碼符號(hào)的條件概率估計(jì)值。只要利用適當(dāng)?shù)纳舷挛哪Ｐ停湍芨鶕?jù)待編碼符號(hào)周圍的已編碼符號(hào)，在不同的概率模型間進(jìn)行切換，進(jìn)而充份利用符號(hào)間的冗余性。每個(gè)語法元素都可以保持不同的模型（例如，運(yùn)動(dòng)矢量和變換系數(shù)具有不同的模型）。相較于VLC熵編碼方法 (UVLC/CAVLC)，CABAC 能多節(jié)省10％bit速率。
加權(quán)預(yù)測(cè)：它利用前向和后向預(yù)測(cè)的加權(quán)總和建立對(duì)雙向內(nèi)插宏模塊的預(yù)測(cè)，這樣可以提高場(chǎng)景變化時(shí)的編碼效率，尤其是在衰落情況下。
保真度范圍擴(kuò)展：2004年7月，H.264標(biāo)準(zhǔn)增加了稱為保真度范圍擴(kuò)展 (FRExt) [11]的新修訂。這次擴(kuò)展在H.264中添加了一整套工具，而且允許采用附加的色域、視頻格式和位深度。另外還增加了對(duì)無損幀間編碼與立體顯示視頻的支持。FRExt修訂版在H.264中引入了4種新類，即：
•High Profile (HP)：用于標(biāo)準(zhǔn) 4:2:0色度采樣，每分量8位彩色。此類引入了新的工具—— 隨后詳述。
•High 10 Profile (Hi10P)：用于更高清晰度視頻顯示的標(biāo)準(zhǔn) 4:2:0 色度采樣，10位彩色。
•High 4:2:2 10 bit color profile (H422P)：用于源編輯功能。
•High 4:4:4 12 bit color profile (H444P)：最高品質(zhì)的源編輯與色彩保真度，支持視頻區(qū)域的無損編碼以及與新的整數(shù)色域變換（從RGB到Y(jié)UV及黑色）。
在新的應(yīng)用領(lǐng)域中，H.264 HP對(duì)廣播與DVD尤為有利。某些試驗(yàn)顯示出H.264 HP的性能比MPEG2 提高了3倍。下面介紹H.264 HP中引入的主要附加工具。
自適應(yīng)殘差塊大小與整數(shù)8(8變換：用于變換編碼的殘差塊可以在8(8與4(4之間切換。引入了用于8(8塊的新16位整數(shù)變換。較小的塊仍然可以采用以前的4(4變換。
8(8亮度幀內(nèi)預(yù)測(cè)：增加了8種模式，除之前的16(16和4(4塊以外，使亮度內(nèi)部宏模塊還能夠?qū)?(8塊進(jìn)行幀內(nèi)預(yù)測(cè)。
量化加權(quán)：用于量化8(8變換系數(shù)的新量化加權(quán)矩陣。
單色：支持黑／白視頻編碼。

AVS
2002 年，中國(guó)信息產(chǎn)業(yè)部成立的音視頻技術(shù)標(biāo)準(zhǔn) (AVS)工作組宣布準(zhǔn)備針對(duì)移動(dòng)多媒體、廣播、DVD等應(yīng)用編寫一份國(guó)家標(biāo)準(zhǔn)。該視頻標(biāo)準(zhǔn)稱為AVS [14]，由兩個(gè)相關(guān)部分組成針對(duì)移動(dòng)視頻應(yīng)用的AVS-M和針對(duì)廣播與DVD的AVS1.0。AVS標(biāo)準(zhǔn)與H.264相似。
AVS1.0同時(shí)支持隔行和逐行掃描模式。AVS中P幀可以利用2幀的前向參考幀，同時(shí)允許B幀采用前后各一個(gè)幀。在隔行模式下，4個(gè)場(chǎng)可以用作參考?？梢詢H在幀級(jí)執(zhí)行隔行模式中的幀／場(chǎng)編碼，這一點(diǎn)與H.264不同，其中允許此選項(xiàng)的MB級(jí)自適應(yīng)。AVS具有與H.264相似的環(huán)路濾波器，可以在幀級(jí)關(guān)閉。另外，B幀還無需環(huán)路濾波器。幀內(nèi)預(yù)測(cè)是以8(8塊為單位進(jìn)行。MC允許對(duì)亮度塊進(jìn)行1／4象素補(bǔ)償。ME的塊大小可以是16(16、16(8、8(16或8(8。變換方式是基于16位的8(8整數(shù)變換（與WMV9相似）。VLC是基于上下文自適應(yīng)2D運(yùn)行／級(jí)別編碼。采用4個(gè)不同的Exp-Golomb編碼。用于每個(gè)已量化系數(shù)的編碼自適應(yīng)到相同8(8塊中前面的符號(hào)。由于Exp-Golomb表是參數(shù)化的表，因此表較小。用于逐行視頻序列的AVS 1.0的視頻質(zhì)量在相同比特率時(shí)稍遜于H.264主類。
AVS-M主要針對(duì)移動(dòng)視頻應(yīng)用，與H.264基本規(guī)范存在交叉。它僅支持逐行視頻、I與P幀，不支持B幀。主要AVS-M編碼工具包括基于4(4塊的幀內(nèi)預(yù)測(cè)、1／４象素運(yùn)動(dòng)補(bǔ)償、整數(shù)變換與量化、上下文自適應(yīng)VLC以及高度簡(jiǎn)化的環(huán)路濾波器。與H.264基本規(guī)范相似AVS-M中的運(yùn)動(dòng)矢量塊大小降至4(4，因此MB可擁有多達(dá)16個(gè)運(yùn)動(dòng)矢量。采用多幀預(yù)測(cè)，但僅支持2個(gè)參考幀。此外，AVS-M中還定義了H.264 HRD／SEI消息的子集。AVS-M的編碼頻率約為0.3dB，在相同設(shè)置下稍遜于H.264基本規(guī)范，而×××的復(fù)雜性卻降低了大約20％。

H.264和AVS的背景
H.264/MPEG-4AVC是ITU-T的VCG（Video Coding Experts Group）和ISO/IEC的MPEG(Moving Picture Experts Group)聯(lián)合開發(fā)的新一代視頻編碼標(biāo)準(zhǔn)。應(yīng)用范圍包括可視電話、視頻會(huì)議等。H.264的主要特色就是極大得提高了壓縮率，是MPEG-2及MPEG-4壓縮效率的一倍以上。H.264核心技術(shù)與之前標(biāo)準(zhǔn)相同，仍采用基于預(yù)測(cè)變換的混合編碼框架，但是在細(xì)節(jié)的實(shí)現(xiàn)上有很大不同，就是細(xì)節(jié)上的改進(jìn)導(dǎo)致壓縮效率極大得提高。而且新一代視頻編碼標(biāo)準(zhǔn)H.264具有良好的網(wǎng)絡(luò)適應(yīng)性和容錯(cuò)等特點(diǎn)。
AVS的誕生可以說是一個(gè)歷史的機(jī)遇，面對(duì)H.264以及MPEG-2等標(biāo)準(zhǔn)高額的專利費(fèi)，我國(guó)數(shù)字視頻產(chǎn)業(yè)面臨嚴(yán)重挑戰(zhàn)。加上我國(guó)致力于提高國(guó)內(nèi)數(shù)字音視頻產(chǎn)業(yè)的核心競(jìng)爭(zhēng)力，由國(guó)家信息產(chǎn)業(yè)部科學(xué)技術(shù)司于2006年6月批準(zhǔn)成立了“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組”，聯(lián)合國(guó)內(nèi)從事數(shù)字音視頻編解碼技術(shù)研發(fā)的科研機(jī)構(gòu)和企業(yè)，針對(duì)我國(guó)音視頻產(chǎn)業(yè)的需求，提出了我國(guó)自主知識(shí)產(chǎn)權(quán)的信源編碼標(biāo)準(zhǔn)―――《信息技術(shù) 先進(jìn)音視頻編碼》系列標(biāo)準(zhǔn)，簡(jiǎn)稱AVS(audio video coding standard).自主的AVS標(biāo)準(zhǔn)在技術(shù)和性能上處于國(guó)際先進(jìn)水平，如果抓住這次機(jī)遇，我國(guó)在技術(shù)－專利－標(biāo)準(zhǔn)－芯片－系統(tǒng)－產(chǎn)業(yè)這個(gè)產(chǎn)業(yè)鏈上，就有可能具有全面的主動(dòng)權(quán)。

H.264和AVS核心技術(shù)分析及對(duì)比
H.264和以前的標(biāo)準(zhǔn)一樣，還是采用的混合編碼的框架，AVS視頻標(biāo)準(zhǔn)采用了與H.264類似的技術(shù)框架，包括變換、量化、熵編碼、幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)、環(huán)路濾波等模塊。他們核心技術(shù)的不同包括以下幾點(diǎn)：
一、變換和量化
H.264對(duì)殘差數(shù)據(jù)采用基于塊的變換編碼，去除原始圖像的空間冗余，使圖像能力集中在小部分系數(shù)上，直流系數(shù)值一般來說是大的，這樣可以提高壓縮比、增強(qiáng)抗干擾能力。先前標(biāo)準(zhǔn)一般采用DCT變換，這種變換的缺點(diǎn)是會(huì)出現(xiàn)失配現(xiàn)象，原始數(shù)據(jù)經(jīng)過變換和反變換恢復(fù)后會(huì)有一個(gè)差值，由于是實(shí)數(shù)運(yùn)算計(jì)算量也比較大。H.264采用的是基于4×4塊的整數(shù)變換。
AVS采用8×8的整數(shù)變換，可以在16位處理器上無失配地實(shí)現(xiàn)。對(duì)高分辨率的視頻圖像去相關(guān)性要比4×4變換有效，采用了64級(jí)量化，可以適應(yīng)不同的應(yīng)用和業(yè)務(wù)對(duì)碼流和質(zhì)量的要求。

二、幀內(nèi)預(yù)測(cè)
H.264和AVS技術(shù)都采用幀內(nèi)預(yù)測(cè)的方式，用相鄰的像素預(yù)測(cè)當(dāng)前塊，采用代表空間域紋理的多種預(yù)測(cè)模式。H.264的亮度預(yù)測(cè)有4×4塊和16×16塊2種預(yù)測(cè)方式，對(duì)于4×4的塊：從－135度到＋22.5度方向加上一個(gè)直流預(yù)測(cè)一共是9種預(yù)測(cè)方向；對(duì)于16×16塊：有4種預(yù)測(cè)方向。色度預(yù)測(cè)是8×8塊，有4種預(yù)測(cè)模式，類似于幀內(nèi)16×16預(yù)測(cè)的4種模式，其中DC為模式0、水平為模式1、垂直為模式2、平面為模式3。

三、幀間預(yù)測(cè)
H.264幀間預(yù)測(cè)是利用以編碼視頻幀和基于塊的運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)模式，與以往標(biāo)準(zhǔn)幀間預(yù)測(cè)的區(qū)別在于塊尺寸范圍更廣、亞像素運(yùn)動(dòng)矢量的使用和多參考幀的運(yùn)用。
H.264有16×16、16×8、8×16、8×8、8×4、4×8和4×4一共8種宏塊及子宏塊劃分，而AVS只有16×16、16×8、8×16和8×8一共4種宏塊劃分方式。
H.264支持使用多個(gè)不同的參考幀對(duì)幀間宏塊和片進(jìn)行預(yù)測(cè)，AVS中P幀可以利用至多2幀的前向參考幀，B幀采用前后各一個(gè)參考幀。

四、熵編碼
H.264制定了基于信息量的熵編碼效率，一種是對(duì)所有的待編碼的符號(hào)采用統(tǒng)一的可變長(zhǎng)編碼（UVLC），另一種是采用基于內(nèi)容的自適應(yīng)二進(jìn)制算術(shù)編碼（CABAC, Context-Adaptive Binary Arithmetic Coding），大大減少了塊編碼相關(guān)性冗余，提高了編碼效率。UVLC計(jì)算復(fù)雜度較低，主要針對(duì)對(duì)編碼時(shí)間很嚴(yán)格的應(yīng)用，缺點(diǎn)就是效率低，碼率較高。CABAC是一種效率很高的熵編碼方法，其編碼效率比UVLC編碼高50%。
AVS熵編碼采用自適應(yīng)變長(zhǎng)編碼技術(shù)。在AVS熵編碼過程中，所有的語法元素和殘差數(shù)據(jù)都是以指數(shù)哥倫布碼的形式映射成二進(jìn)制比特流。
采用指數(shù)哥倫布碼的優(yōu)勢(shì)在于：一方面，它的硬件復(fù)雜度比較低，可以根據(jù)閉合公式解析碼子，無需查表；另一方面，它可以根據(jù)編碼元素的概率分布靈活地確定以K階指數(shù)哥倫布碼編碼，如果K選得恰當(dāng)，則編碼效率可以逼近信息熵。
對(duì)預(yù)測(cè)殘差的塊變換系數(shù)，經(jīng)掃描形成（level、run）對(duì)串，level、run不是獨(dú)立事件，而存在著很強(qiáng)的相關(guān)性，在AVS中l(wèi)evel、run采用二維聯(lián)合編碼，并根據(jù)當(dāng)前l(fā)evel、run的不同概率分布趨勢(shì)，自適應(yīng)改變指數(shù)哥倫布碼的階數(shù)。
另外，在AVS中沒有SI、SP幀。可以這樣說，AVS是在H.264的基礎(chǔ)上發(fā)展起來的，吸收了H.264的精華，但為了繞過專利的困擾，又不得不放棄H.264的一些核心算法。換來的代價(jià)就是，編碼效率稍微降低一點(diǎn)的情況下，復(fù)雜度極大得降低了。
AVS是我國(guó)自主知識(shí)產(chǎn)權(quán)的標(biāo)準(zhǔn)，現(xiàn)在還沒有大規(guī)模使用，處在起步階段。大多數(shù)企業(yè)處于觀望狀態(tài)，沒有資金大量投入，面臨重重困難，但是它的廣闊前景是不容忽視的，又有國(guó)家的大力支持，一定會(huì)發(fā)展的更加完美。

標(biāo)題名稱：H.264與AVS視頻標(biāo)準(zhǔn)核心技術(shù)比較-創(chuàng)新互聯(lián)
分享鏈接：http://www.muchs.cn/article24/epdce.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站排名、做網(wǎng)站、商城網(wǎng)站、外貿(mào)網(wǎng)站建設(shè)、外貿(mào)建站、網(wǎng)站設(shè)計(jì)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容