文獻標識碼: A
文章編號: 0258-7998(2015)04-0159-04
0 引言
近年來,隨著多媒體技術的快速發展,人們對圖像壓縮的要求越來越高,某些情況下,JPEG標準和JPEG2000標準已經無法滿足要求,為此,必須采用一種新的壓縮技術對圖像進行有效壓縮。感興趣區域(Region of Interest,ROI)編碼技術利用了人眼的視覺特性,已成為目前圖像壓縮研究的熱點。所謂ROI編碼,就是將圖像中比較關注區域(亦稱ROI)的位平面設置得比其余區域(亦稱BG)的位平面高,就可優先傳輸ROI系數,相對提高圖像質量。
對于ROI編碼,一些學者根據JPEG2000標準提供的一般位移(General Shift,GShift)法和最大位移(Maximum Shift,MaxShift)法,提出了一些改進方法。Wang Zhou[1]等提出了逐個位平面位移(BbBShift)法,該方法先上移重要的ROI位平面,然后逐個交替上移剩余的ROI位平面和一些BG位平面,剩余的BG位平面不位移。Liu Lijie[2]等提出了部分重要位平面位移(PSBShift)法,該方法將ROI位平面分為兩部分,上移其中重要的ROI位平面。梁燕[3]提出了通用的部分位平面位移(GPBShift)法,該方法上移重要的ROI位平面,同時下移非重要的BG位平面,其余的位平面保持不變。這些改進方法的實質都是先傳輸ROI系數,然后傳輸BG系數和剩余的ROI系數。
本文通過研究前人的方法,提出了部分背景位平面位移(Partial Background Bitplanes Shift,PBBShift)法,并將此方法嵌入到多級樹集合分裂(Set Partitioning in Hierarchical Trees,SPIHT)算法中。該方法可使圖像觀察者先對圖像情況大致了解,然后決定是否需要。這種改進的方法可用于帶寬受限的網絡中。
1 多級樹集合分裂(SPIHT)算法
SPIHT算法是在嵌入式零樹小波(EZW)算法[4]的基礎上提出的一種新算法[5]。該算法采用空間方向樹、全體子孫集合和非直系子孫集合的概念,提高了編碼效率[6]。SPIHT算法還能生成一個嵌入碼流,接收的碼流在任意點被截斷時都可重構圖像。
SPIHT算法的編碼過程由正向小波變換、量化編碼等組成。在SPIHT算法的基礎上嵌入ROI部分:確定ROI、生成ROI模板、下移BG位平面、ROI形狀和位置信息編碼,從而形成基于GShift法的ROI編碼過程,如圖1所示。解碼是編碼的逆過程。
圖1 基于GShift法的ROI編碼過程
2 ROI編碼
2.1 ROI掩模
定義ROI掩模來標定小波系數中屬于ROI的點。若將ROI定義為矩形,此時只需確定矩形的左上角坐標(x1,y1)和右下角坐標(x2,y2)。ROI掩模M(i,j)可由式(1)表示[7],其生成過程[7]如圖2所示。
2.2 ROI編碼方法
GShift法和MaxShift法是兩種最基本、最常用的ROI編碼方法[8],如圖3所示。在GShift法中,選擇一個位移因子S把BG位平面都下降S位,這樣,ROI的最重要位平面就高于BG的所有位平面,ROI就可以優先編碼。解碼時,ROI就能獲得較好的恢復。S越大,ROI相對BG的優先級越高,質量也就越高。當GShift法中的位移因子S增大到使得ROI位平面與BG位平面無重疊時,此時GShift法就變成了MaxShift法。
圖3 兩種ROI編碼方法[8]
3 改進方法
3.1 部分背景位平面位移(PBBShift)法
某些情況下,觀察者想在圖像剛開始解碼時了解一下圖像的大概情況,這就需要一部分BG位平面置于與ROI位平面同等高的位平面上。根據GShift法,本文提出了PBBShift法,如圖4所示,其中S1為BG的重要位平面,S2為BG剩余位平面的下移位數。PBBShift法將BG位平面分為兩部分:重要位平面和剩余位平面。編碼時,BG的重要位平面不位移,剩余位平面向下位移。解碼時只需將BG的剩余位平面上移即可。由于該方法只需下移部分BG位平面,故稱此方法為PBBShift法。
圖4 PBBShift法
3.2 編碼流程圖
相比GShift法的ROI編碼過程,PBBShift法的ROI編碼部分相對復雜些,它要將BG位平面分為兩部分分別進行位移,具體的編碼過程如圖5所示。解碼是編碼的逆過程。
4 實驗分析與結論
圖5 PBBShift法編碼過程
圖6 Lena原圖
實驗選取Lena圖像(512×512,8 bit),如圖6所示,ROI定義在臉部,為矩形。實驗采用MATLAB編程,將ROI部分嵌入到SPIHT算法中,先進行6級9/7小波變換,然后用PBCBShift法對位平面進行位移,其中S1=2,S2=2,最后得到編碼數據流。圖像的客觀評價用峰值信噪比(PSNR)表示,單位為分貝(dB),PSNR越大,質量越好。圖7為PBBShift法下各區域的PSNR對比。圖8為PBBShift法得到的主觀視覺效果圖。實驗還將PBBShift法與No-Shift法、GShift法作比較,圖9為3種方法得到的PSNR實驗結果,其中,(a)為ROI的PSNR對比,(b)為BG的PSNR對比,(c)為全圖的PSNR對比。由于選取的ROI的面積占整幅圖像的比重小,所以全圖的PSNR接近于BG的PSNR。
圖7 PBBShift法各區域PSNR對比
從圖7可知,低碼率下,ROI和BG的PSNR都比較小,相差不大;隨著碼率的增大,ROI的PSNR先快速增大,然后平穩增大,而BG的PSNR先緩慢增大,然后平穩增大。從圖8看出,低碼率下,ROI和BG都比較模糊,但能看出輪廓;隨著碼率的增大,ROI比BG獲得更好的視覺效果,當碼率增大到一定時,ROI和BG都很清楚。
圖8 PBBShift法得到的主觀視覺效果圖
圖9 3種算法得到的PSNR對比
從圖9(a)看出,對于ROI,低碼率下,PBBShift法和No-Shift法得到的PSNR相差不大;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都低于GShift法的PSNR。從圖9(b)看出,對于BG,低碼率下,PBBShift法和No-Shift法得到的PSNR相差不大;隨著碼率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是兩者的PSNR都高于GShift法的PSNR。
從上面幾組實驗,得出以下結論:
(1)本文提出的方法先解碼ROI系數和重要的BG系數,后解碼剩余的BG系數。運用該方法可先了解圖像的大致內容,繼續解碼時,ROI將比BG獲得更好的視覺效果。
(2)本文提出的方法介于GShift法和No-Shift法之間。要使BG在低碼率下能較清楚地顯示,只需增大S1的值,此時本文方法就接近No-Shift法。要使ROI與BG有更大的視覺對比度,只需增大S2的值,此時本文方法就接近GShift法。
5 總結
ROI編碼技術是靜態圖像壓縮標準支持的一種新技術,該技術為圖像的高性能壓縮提供了很好的解決方案。本文在分析GShift法的基礎上,提出了一種改進的ROI編碼方法,即PBBShift法。本文的創新點在于,該方法可以使觀察者先了解圖像的大致情況,如果是需要的圖像就繼續傳輸,ROI將比BG獲得更好的視覺效果,如果不是需要的圖像就停止傳輸,節省等待時間。實驗證明,該方法是有效的。這種改進的ROI編碼技術將在未來圖像壓縮領域發揮重大的作用。
參考文獻
[1] Wang Zhou,BOVIK A C.Bitplane-by-Bitplane shift (BbBShift)-a suggestion for JPEG2000 region of interest image coding[J].IEEE Signal Processing Letters,2002,9(5):160-162.
[2] Liu Lijie,Fan Guoliang.A new JPEG2000 region of interest image coding method:partial significant bitplanes shift[J].IEEE Signal Processing Letters,2003,10(2):35-38.
[3] 梁燕.基于小波變換的序列圖像感興趣區域編碼[D].天津:天津大學,2005.
[4] 牛德智,陳長興,王曙釗,等.一種基于EZW改進算法的圖像壓縮方法研究[J].電子技術應用,2010,36(12):128-131.
[5] JAIN V,JAIN N,PARIKH A.Comparative analysis of image compression using image interpolation and SPIHT encoding[C].Engineering and Systems(SCES),2012:1-6.
[6] 陳秀梅,王偉,湯敏.基于Curvelet變換和SPIHT算法的醫學圖像感興趣區域壓縮[J].中國醫學影像學雜志,2014,22(10):786-792.
[7] 小野定康,鈴木純司.JPEG2000技術[M].北京:科學出版社,2004.
[8] 袁建亮,朱遠平.基于JPEG2000的感興趣區域壓縮編碼算法[J].天津師范大學學報(自然科學版),2014,34(1):42-46.