H.264與AVS視頻標(biāo)準(zhǔn)核心技術(shù)比較-創(chuàng)新互聯(lián)

視頻編碼技術(shù)在過去幾年最重要的發(fā)展之一是由ITU和ISO/IEC的聯(lián)合視頻小組 (JVT)開發(fā)了H.264/MPEG-4 AVC[8]標(biāo)準(zhǔn)。在發(fā)展過程中,業(yè)界為這種新標(biāo)準(zhǔn)取了許多不同的名稱。ITU在1997年開始利用重要的新編碼工具處理H.26L(長(zhǎng)期),結(jié)果令人鼓舞,于是ISO決定聯(lián)手ITU組建JVT并采用一個(gè)通用的標(biāo)準(zhǔn)。因此,大家有時(shí)會(huì)聽到有人將這項(xiàng)標(biāo)準(zhǔn)稱為JVT,盡管它并非正式名稱。ITU在2003年5月批準(zhǔn)了新的H.264標(biāo)準(zhǔn)。ISO在2003年10 月以MPEG-4 Part 10、高級(jí)視頻編碼或AVC的名稱批準(zhǔn)了該標(biāo)準(zhǔn)。

H.264 實(shí)現(xiàn)的改進(jìn)創(chuàng)造了新的市場(chǎng)機(jī)遇
H.264/AVC在壓縮效率方面取得了巨大突破,一般情況下達(dá)到MPEG-2及MPEG-4簡(jiǎn)化類壓縮效率的大約2倍。在JVT進(jìn)行的正式測(cè)試中,H.264在85個(gè)測(cè)試案例中有78%的案例實(shí)現(xiàn)1.5倍以上的編碼效率提高,77%的案例中達(dá)到2倍以上,部分案例甚至高達(dá)4倍。H.264 實(shí)現(xiàn)的改進(jìn)創(chuàng)造了新的市場(chǎng)機(jī)遇,如:600Kbps的VHS品質(zhì)視頻可以通過ADSL線路實(shí)現(xiàn)視頻點(diǎn)播;高清晰電影無需新的激光頭即可適應(yīng)普通 DVD。
H.264標(biāo)準(zhǔn)化時(shí)支持三個(gè)類別:基本類、主類及擴(kuò)展類。后來一項(xiàng)稱為高保真范圍擴(kuò)展 (FRExt)的修訂引入了稱為高級(jí)類的4個(gè)附加類。在初期主要是基本類和主類引起了大家的興趣?;绢惤档土擞?jì)算及系統(tǒng)內(nèi)存需求,而且針對(duì)低時(shí)延進(jìn)行了優(yōu)化。由于B幀的內(nèi)在時(shí)延以及CABAC的計(jì)算復(fù)雜性,因此它不包括這兩者?;绢惙浅_m合可視電話應(yīng)用以及其他需要低成本實(shí)時(shí)編碼的應(yīng)用。
主類提供的壓縮效率最高,但其要求的處理能力也比基本類高許多,因此使其難以用于低成本實(shí)時(shí)編碼和低時(shí)延應(yīng)用。廣播與內(nèi)容存儲(chǔ)應(yīng)用對(duì)主類最感興趣,它們是為了盡可能以最低的比特率獲得最高的視頻質(zhì)量。
盡管H.264采用與舊標(biāo)準(zhǔn)相同的主要編碼功能,不過它還具有許多與舊標(biāo)準(zhǔn)不同的新功能,它們一起實(shí)現(xiàn)了編碼效率的提高。其主要差別,概述如下:
幀內(nèi)預(yù)測(cè)與編碼:H.264采用空域幀內(nèi)預(yù)測(cè)技術(shù)來預(yù)測(cè)相鄰塊鄰近像素的Intra-MB中的像素。它對(duì)預(yù)測(cè)殘差信號(hào)和預(yù)測(cè)模式進(jìn)行編碼,而不是編碼塊中的實(shí)際像素。這樣可以顯著提高幀內(nèi)編碼效率。
幀間預(yù)測(cè)與編碼:H.264中的幀間編碼采用了舊標(biāo)準(zhǔn)的主要功能,同時(shí)也增加了靈活性及可操作性,包括適用于多種功能的幾種塊大小選項(xiàng),如:運(yùn)動(dòng)補(bǔ)償、四分之一像素運(yùn)動(dòng)補(bǔ)償、多參考幀、通用 (generalized)雙向預(yù)測(cè)和自適應(yīng)環(huán)路去塊。
可變矢量塊大?。涸试S采用不同塊大小執(zhí)行運(yùn)動(dòng)補(bǔ)償??梢詾樾≈?(4的塊傳輸單個(gè)運(yùn)動(dòng)矢量,因此在雙向預(yù)測(cè)情況下可以為單個(gè)MB傳輸多達(dá)32個(gè)運(yùn)動(dòng)矢量。另外還支持16(8、8(16、8(8、8(4和4(8的塊大小。降低塊大小可以提高運(yùn)動(dòng)細(xì)節(jié)的處理能力,因而提高主觀質(zhì)量感受,包括消除較大的塊化失真。
四分之一像素運(yùn)動(dòng)估計(jì):通過允許半像素和四分之一像素運(yùn)動(dòng)矢量分辨率可以改善運(yùn)動(dòng)補(bǔ)償。
多參考幀預(yù)測(cè):16個(gè)不同的參考幀可以用于幀間編碼,從而可以改善視頻質(zhì)量的主觀感受并提高編碼效率。提供多個(gè)參考幀還有助于提高H.264位流的容錯(cuò)能力。值得注意的是,這種特性會(huì)增加編碼器與×××的內(nèi)存需求,因?yàn)楸仨氃趦?nèi)存中保存多個(gè)參考幀。
自適應(yīng)環(huán)路去塊濾波器:H.264采用一種自適應(yīng)解塊濾波器,它會(huì)在預(yù)測(cè)回路內(nèi)對(duì)水平和垂直區(qū)塊邊緣進(jìn)行處理,用于消除塊預(yù)測(cè)誤差造成的失真。這種濾波通常是基于4(4塊邊界為運(yùn)算基礎(chǔ),其中邊界各邊的3個(gè)像素可通過4級(jí)濾波器進(jìn)行更新。
整數(shù)變換:采用DCT的早期標(biāo)準(zhǔn)必須為逆變換的固點(diǎn)實(shí)施來定義舍入誤差的容差范圍。編碼器與×××之間的 IDCT 精度失配造成的漂移是質(zhì)量損失的根源。H.264利用整數(shù)4(4空域變換解決了這一問題——這種變換是DCT的近似值。4(4的小區(qū)塊還有助于減少阻塞與振鈴失真。
量化與變換系數(shù)掃描:變換系數(shù)通過標(biāo)量量化方式得到量化,不產(chǎn)生加大的死區(qū)。與之前的標(biāo)準(zhǔn)類似,每個(gè)MB都可選擇不同的量化步長(zhǎng),不過步長(zhǎng)以大約12.5%的復(fù)合速率增加,而不是固定遞增。同時(shí),更精細(xì)的量化步長(zhǎng)還可以用于色度成分,尤其是在粗劣量化光度系數(shù)的情況下。
熵編碼:與根據(jù)所涉及的數(shù)據(jù)類型提供多個(gè)靜態(tài)VLC表的先前標(biāo)準(zhǔn)不同,H.264針對(duì)變換系數(shù)采用上下文自適應(yīng)VLC,同時(shí)針對(duì)所有其他符號(hào)采用統(tǒng)一的VLC (UniversalVLC)方法。主類還支持新的上下文自適應(yīng)二進(jìn)制算術(shù)編碼器 (CABAC)。CAVLC優(yōu)于以前的VLC實(shí)施,不過成本卻比VLC高。
CABAC利用編碼器和譯碼器的機(jī)率模型來處理所有語法元素 (syntax elements),包括:變換系數(shù)和運(yùn)動(dòng)矢量。為了提高算術(shù)編碼的編碼效率,基本概率模型通過一種稱為上下文建模的方法對(duì)視頻幀內(nèi)不斷變換的統(tǒng)計(jì)進(jìn)行適應(yīng)。上下文建模分析提供編碼符號(hào)的條件概率估計(jì)值。只要利用適當(dāng)?shù)纳舷挛哪P停湍芨鶕?jù)待編碼符號(hào)周圍的已編碼符號(hào),在不同的概率模型間進(jìn)行切換,進(jìn)而充份利用符號(hào)間的冗余性。每個(gè)語法元素都可以保持不同的模型(例如,運(yùn)動(dòng)矢量和變換系數(shù)具有不同的模型)。相較于VLC熵編碼方法 (UVLC/CAVLC),CABAC 能多節(jié)省10%bit速率。
加權(quán)預(yù)測(cè):它利用前向和后向預(yù)測(cè)的加權(quán)總和建立對(duì)雙向內(nèi)插宏模塊的預(yù)測(cè),這樣可以提高場(chǎng)景變化時(shí)的編碼效率,尤其是在衰落情況下。
保真度范圍擴(kuò)展:2004年7月,H.264標(biāo)準(zhǔn)增加了稱為保真度范圍擴(kuò)展 (FRExt) [11]的新修訂。這次擴(kuò)展在H.264中添加了一整套工具,而且允許采用附加的色域、視頻格式和位深度。另外還增加了對(duì)無損幀間編碼與立體顯示視頻的支持。FRExt修訂版在H.264中引入了4種新類,即:
•High Profile (HP):用于標(biāo)準(zhǔn) 4:2:0色度采樣,每分量8位彩色。此類引入了新的工具—— 隨后詳述。
•High 10 Profile (Hi10P):用于更高清晰度視頻顯示的標(biāo)準(zhǔn) 4:2:0 色度采樣,10位彩色。
•High 4:2:2 10 bit color profile (H422P):用于源編輯功能。
•High 4:4:4 12 bit color profile (H444P):最高品質(zhì)的源編輯與色彩保真度,支持視頻區(qū)域的無損編碼以及與新的整數(shù)色域變換(從RGB到Y(jié)UV及黑色)。
在新的應(yīng)用領(lǐng)域中,H.264 HP對(duì)廣播與DVD尤為有利。某些試驗(yàn)顯示出H.264 HP的性能比MPEG2 提高了3倍。下面介紹H.264 HP中引入的主要附加工具。
自適應(yīng)殘差塊大小與整數(shù)8(8變換:用于變換編碼的殘差塊可以在8(8與4(4之間切換。引入了用于8(8塊的新16位整數(shù)變換。較小的塊仍然可以采用以前的4(4變換。
8(8亮度幀內(nèi)預(yù)測(cè):增加了8種模式,除之前的16(16和4(4塊以外,使亮度內(nèi)部宏模塊還能夠?qū)?(8塊進(jìn)行幀內(nèi)預(yù)測(cè)。
量化加權(quán):用于量化8(8變換系數(shù)的新量化加權(quán)矩陣。
單色:支持黑/白視頻編碼。

AVS
2002 年,中國(guó)信息產(chǎn)業(yè)部成立的音視頻技術(shù)標(biāo)準(zhǔn) (AVS)工作組宣布準(zhǔn)備針對(duì)移動(dòng)多媒體、廣播、DVD等應(yīng)用編寫一份國(guó)家標(biāo)準(zhǔn)。該視頻標(biāo)準(zhǔn)稱為AVS [14],由兩個(gè)相關(guān)部分組成針對(duì)移動(dòng)視頻應(yīng)用的AVS-M和針對(duì)廣播與DVD的AVS1.0。AVS標(biāo)準(zhǔn)與H.264相似。
AVS1.0同時(shí)支持隔行和逐行掃描模式。AVS中P幀可以利用2幀的前向參考幀,同時(shí)允許B幀采用前后各一個(gè)幀。在隔行模式下,4個(gè)場(chǎng)可以用作參考??梢詢H在幀級(jí)執(zhí)行隔行模式中的幀/場(chǎng)編碼,這一點(diǎn)與H.264不同,其中允許此選項(xiàng)的MB級(jí)自適應(yīng)。AVS具有與H.264相似的環(huán)路濾波器,可以在幀級(jí)關(guān)閉。另外,B幀還無需環(huán)路濾波器。幀內(nèi)預(yù)測(cè)是以8(8塊為單位進(jìn)行。MC允許對(duì)亮度塊進(jìn)行1/4象素補(bǔ)償。ME的塊大小可以是16(16、16(8、8(16或8(8。變換方式是基于16位的8(8整數(shù)變換(與WMV9相似)。VLC是基于上下文自適應(yīng)2D運(yùn)行/級(jí)別編碼。采用4個(gè)不同的Exp-Golomb編碼。用于每個(gè)已量化系數(shù)的編碼自適應(yīng)到相同8(8塊中前面的符號(hào)。由于Exp-Golomb表是參數(shù)化的表,因此表較小。用于逐行視頻序列的AVS 1.0的視頻質(zhì)量在相同比特率時(shí)稍遜于H.264主類。
AVS-M主要針對(duì)移動(dòng)視頻應(yīng)用,與H.264基本規(guī)范存在交叉。它僅支持逐行視頻、I與P幀,不支持B幀。主要AVS-M編碼工具包括基于4(4塊的幀內(nèi)預(yù)測(cè)、1/4象素運(yùn)動(dòng)補(bǔ)償、整數(shù)變換與量化、上下文自適應(yīng)VLC以及高度簡(jiǎn)化的環(huán)路濾波器。與H.264基本規(guī)范相似AVS-M中的運(yùn)動(dòng)矢量塊大小降至4(4,因此MB可擁有多達(dá)16個(gè)運(yùn)動(dòng)矢量。采用多幀預(yù)測(cè),但僅支持2個(gè)參考幀。此外,AVS-M中還定義了H.264 HRD/SEI消息的子集。AVS-M的編碼頻率約為0.3dB,在相同設(shè)置下稍遜于H.264基本規(guī)范,而×××的復(fù)雜性卻降低了大約20%。

H.264和AVS的背景
H.264/MPEG-4AVC是ITU-T的VCG(Video Coding Experts Group)和ISO/IEC的MPEG(Moving Picture Experts Group)聯(lián)合開發(fā)的新一代視頻編碼標(biāo)準(zhǔn)。應(yīng)用范圍包括可視電話、視頻會(huì)議等。H.264的主要特色就是極大得提高了壓縮率,是MPEG-2及MPEG-4壓縮效率的一倍以上。H.264核心技術(shù)與之前標(biāo)準(zhǔn)相同,仍采用基于預(yù)測(cè)變換的混合編碼框架,但是在細(xì)節(jié)的實(shí)現(xiàn)上有很大不同,就是細(xì)節(jié)上的改進(jìn)導(dǎo)致壓縮效率極大得提高。而且新一代視頻編碼標(biāo)準(zhǔn)H.264具有良好的網(wǎng)絡(luò)適應(yīng)性和容錯(cuò)等特點(diǎn)。
AVS的誕生可以說是一個(gè)歷史的機(jī)遇,面對(duì)H.264以及MPEG-2等標(biāo)準(zhǔn)高額的專利費(fèi),我國(guó)數(shù)字視頻產(chǎn)業(yè)面臨嚴(yán)重挑戰(zhàn)。加上我國(guó)致力于提高國(guó)內(nèi)數(shù)字音視頻產(chǎn)業(yè)的核心競(jìng)爭(zhēng)力,由國(guó)家信息產(chǎn)業(yè)部科學(xué)技術(shù)司于2006年6月批準(zhǔn)成立了“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組”,聯(lián)合國(guó)內(nèi)從事數(shù)字音視頻編解碼技術(shù)研發(fā)的科研機(jī)構(gòu)和企業(yè),針對(duì)我國(guó)音視頻產(chǎn)業(yè)的需求,提出了我國(guó)自主知識(shí)產(chǎn)權(quán)的信源編碼標(biāo)準(zhǔn)―――《信息技術(shù) 先進(jìn)音視頻編碼》系列標(biāo)準(zhǔn),簡(jiǎn)稱AVS(audio video coding standard).自主的AVS標(biāo)準(zhǔn)在技術(shù)和性能上處于國(guó)際先進(jìn)水平,如果抓住這次機(jī)遇,我國(guó)在技術(shù)-專利-標(biāo)準(zhǔn)-芯片-系統(tǒng)-產(chǎn)業(yè)這個(gè)產(chǎn)業(yè)鏈上,就有可能具有全面的主動(dòng)權(quán)。

H.264和AVS核心技術(shù)分析及對(duì)比
H.264和以前的標(biāo)準(zhǔn)一樣,還是采用的混合編碼的框架,AVS視頻標(biāo)準(zhǔn)采用了與H.264類似的技術(shù)框架,包括變換、量化、熵編碼、幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)、環(huán)路濾波等模塊。他們核心技術(shù)的不同包括以下幾點(diǎn):
一、變換和量化
H.264對(duì)殘差數(shù)據(jù)采用基于塊的變換編碼,去除原始圖像的空間冗余,使圖像能力集中在小部分系數(shù)上,直流系數(shù)值一般來說是大的,這樣可以提高壓縮比、增強(qiáng)抗干擾能力。先前標(biāo)準(zhǔn)一般采用DCT變換,這種變換的缺點(diǎn)是會(huì)出現(xiàn)失配現(xiàn)象,原始數(shù)據(jù)經(jīng)過變換和反變換恢復(fù)后會(huì)有一個(gè)差值,由于是實(shí)數(shù)運(yùn)算計(jì)算量也比較大。H.264采用的是基于4×4塊的整數(shù)變換。
AVS采用8×8的整數(shù)變換,可以在16位處理器上無失配地實(shí)現(xiàn)。對(duì)高分辨率的視頻圖像去相關(guān)性要比4×4變換有效,采用了64級(jí)量化,可以適應(yīng)不同的應(yīng)用和業(yè)務(wù)對(duì)碼流和質(zhì)量的要求。

二、幀內(nèi)預(yù)測(cè)
H.264和AVS技術(shù)都采用幀內(nèi)預(yù)測(cè)的方式,用相鄰的像素預(yù)測(cè)當(dāng)前塊,采用代表空間域紋理的多種預(yù)測(cè)模式。H.264的亮度預(yù)測(cè)有4×4塊和16×16塊2種預(yù)測(cè)方式,對(duì)于4×4的塊:從-135度到+22.5度方向加上一個(gè)直流預(yù)測(cè)一共是9種預(yù)測(cè)方向;對(duì)于16×16塊:有4種預(yù)測(cè)方向。色度預(yù)測(cè)是8×8塊,有4種預(yù)測(cè)模式,類似于幀內(nèi)16×16預(yù)測(cè)的4種模式,其中DC為模式0、水平為模式1、垂直為模式2、平面為模式3。

三、幀間預(yù)測(cè)
H.264幀間預(yù)測(cè)是利用以編碼視頻幀和基于塊的運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)模式,與以往標(biāo)準(zhǔn)幀間預(yù)測(cè)的區(qū)別在于塊尺寸范圍更廣、亞像素運(yùn)動(dòng)矢量的使用和多參考幀的運(yùn)用。
H.264有16×16、16×8、8×16、8×8、8×4、4×8和4×4一共8種宏塊及子宏塊劃分,而AVS只有16×16、16×8、8×16和8×8一共4種宏塊劃分方式。
H.264支持使用多個(gè)不同的參考幀對(duì)幀間宏塊和片進(jìn)行預(yù)測(cè),AVS中P幀可以利用至多2幀的前向參考幀,B幀采用前后各一個(gè)參考幀。

四、熵編碼
H.264制定了基于信息量的熵編碼效率,一種是對(duì)所有的待編碼的符號(hào)采用統(tǒng)一的可變長(zhǎng)編碼(UVLC),另一種是采用基于內(nèi)容的自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC, Context-Adaptive Binary Arithmetic Coding),大大減少了塊編碼相關(guān)性冗余,提高了編碼效率。UVLC計(jì)算復(fù)雜度較低,主要針對(duì)對(duì)編碼時(shí)間很嚴(yán)格的應(yīng)用,缺點(diǎn)就是效率低,碼率較高。CABAC是一種效率很高的熵編碼方法,其編碼效率比UVLC編碼高50%。
AVS熵編碼采用自適應(yīng)變長(zhǎng)編碼技術(shù)。在AVS熵編碼過程中,所有的語法元素和殘差數(shù)據(jù)都是以指數(shù)哥倫布碼的形式映射成二進(jìn)制比特流。
采用指數(shù)哥倫布碼的優(yōu)勢(shì)在于:一方面,它的硬件復(fù)雜度比較低,可以根據(jù)閉合公式解析碼子,無需查表;另一方面,它可以根據(jù)編碼元素的概率分布靈活地確定以K階指數(shù)哥倫布碼編碼,如果K選得恰當(dāng),則編碼效率可以逼近信息熵。
對(duì)預(yù)測(cè)殘差的塊變換系數(shù),經(jīng)掃描形成(level、run)對(duì)串,level、run不是獨(dú)立事件,而存在著很強(qiáng)的相關(guān)性,在AVS中l(wèi)evel、run采用二維聯(lián)合編碼,并根據(jù)當(dāng)前l(fā)evel、run的不同概率分布趨勢(shì),自適應(yīng)改變指數(shù)哥倫布碼的階數(shù)。
另外,在AVS中沒有SI、SP幀。可以這樣說,AVS是在H.264的基礎(chǔ)上發(fā)展起來的,吸收了H.264的精華,但為了繞過專利的困擾,又不得不放棄H.264的一些核心算法。換來的代價(jià)就是,編碼效率稍微降低一點(diǎn)的情況下,復(fù)雜度極大得降低了。
AVS是我國(guó)自主知識(shí)產(chǎn)權(quán)的標(biāo)準(zhǔn),現(xiàn)在還沒有大規(guī)模使用,處在起步階段。大多數(shù)企業(yè)處于觀望狀態(tài),沒有資金大量投入,面臨重重困難,但是它的廣闊前景是不容忽視的,又有國(guó)家的大力支持,一定會(huì)發(fā)展的更加完美。

標(biāo)題名稱:H.264與AVS視頻標(biāo)準(zhǔn)核心技術(shù)比較-創(chuàng)新互聯(lián)
分享鏈接:http://www.muchs.cn/article24/epdce.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、做網(wǎng)站、商城網(wǎng)站、外貿(mào)網(wǎng)站建設(shè)、外貿(mào)建站、網(wǎng)站設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)