摘 要: 介紹了基于數字圖像的信息隱藏技術的基本內容及方法,著重研究了圖像信息隱藏的反向檢測技術——隱寫分析技術,總結了其方法和分類。針對隱寫分析中的RS(Regularand Singular groups method)檢測算法進行了深入的研究,提出了改進算法,在一定程度上減小了RS檢測算法對統計假設的依賴性,并且在不改變像素間相關特性的同時可以對圖像進行二次檢驗,增加了檢測結果的準確性。在不同的掩碼和嵌入率下進行了大量實驗,實驗結果驗證了該改進算法的有效性,基于該改進算法編寫了檢測程序,實現了對灰度及彩色圖像的LSB(Least Significant Bit)隱藏檢測。
關鍵詞: 信息隱藏;隱寫分析;RS檢測;LSB隱藏
0 引言
隨著數字化信息時代的到來,各種各樣的數字媒體越來越多,數字圖像的信息安全問題越來越受到重視,基于圖像的信息隱藏技術以及其反向檢測技術——隱寫分析技術,成為了新的研究熱點[1]。
信息隱藏技術是將隱秘信息隱藏在其他媒體中,通過載體媒體的傳輸,實現隱秘信息的傳遞甚至達到跟蹤和校驗信息來源的目的。隱寫分析技術作為信息隱藏的反向技術,目的是檢測載體中是否含有隱藏信息。對該技術研究,除了可以檢測隱藏信息之外,還可以了解正向隱藏的缺陷,指導研究者設計更健壯的信息隱藏技術,確保嵌入信息的抗攻擊性。RS[2-3]檢測算法作為一種重要的反向分析方法,對無損嵌入容量的LSB信息隱藏有很好的檢測效果。本文基于該算法,通過對大量不同掩碼及嵌入率下的數據比較,證實了參數對檢測結果的影響,并對該檢測算法提出了改進,提高了檢測的準確性。
1 信息隱藏技術
信息隱藏應用主要有隱寫術、數字水印技術[4]。隱寫術是將秘密信息隱藏到普通的信息(如數字圖像)中進行傳輸。方法主要有利用高空間頻率的圖像數據隱藏信息、采用最低有效位(LSB)方法將信息隱藏到宿主信號中、使用信號的色度隱藏信息、在數字圖像的像素亮度的統計模型上隱藏信息等。
數字水印技術是將一些標識信息(數字水印)在不影響原載體的使用并且不易被他人探知和修改的前提下嵌入到數字載體(圖片、文檔、軟件等)當中。數字水印被廣泛應用于防偽溯源、版權保護、隱藏標識、認證和安全隱蔽通信中。數字水印可以劃分為時(空)域數字水印、頻域數字水印、時/頻域數字水印和時間/尺度域數字水印。
2 信息隱藏分析技術
信息隱藏分析技術也叫隱寫分析技術,是對圖像、音頻、視頻等進行檢測,判斷其中是否嵌有秘密信息。原始數據由于秘密信息的嵌入,導致自身統計特性發生變化,使得分析者可以通過分析載體數據的異常變化來檢測秘密信息的存在,即使無法提取出秘密信息,也能破壞其隱秘通信并追查秘密信息的收發方。由于原始載體很難獲得,因此盲檢測是最常遇到的情況。盲檢測主要是通過統計和算法來對數字圖像特征進行分析,從特征的改變來判斷是否存在信息的嵌入。
根據隱寫分析提取特征的不同,可以分為專用隱寫分析和通用隱寫分析。根據特征所在域的不同又分為時空域和頻率域隱寫分析。時空域分析方法主要針對LSB信息隱藏,該方法實現簡單,但是檢測能力有限。頻率域方法則是通過在頻域檢測特征的變化來判斷信息嵌入,包括傅里葉、拉普拉斯、離散余弦和小波變換等。
針對盲檢測本身難度已較大,要進行通用隱寫分析更是很難實現,所以現在的隱寫分析主要是專用隱寫分析。包括下面一些經典方法:
(1)Chi-Square統計檢測方法。該方法統計調色板圖像嵌入信息前后相對顏色對的概率比來檢測秘密信息的嵌入,但是對信息的隨機嵌入無法檢測。
(2)基于無損嵌入容量的檢測方法,即本文介紹的RS分析法。
(3)基于JPEG兼容性檢測方法。該方法僅適用于JPEG格式的圖像,有比較高的靈敏度,甚至可以檢測到單個像素的改變,當信息嵌入量較大時,還可以估計出信息嵌入的長度。
(4)DCT(Discrete Cosine Transform)系數分析法。通過估計隱秘載體圖像的DCT系數直方圖和原始估計直方圖的相關改變量來估計秘密信息嵌入量,該方法對具有特殊網格結構的圖像檢測無效。
3 數字圖像RS隱寫分析技術及改進
3.1 RS隱寫分析
假設有一個M×N個像素的圖像,它的像素值用集合P來表示(例如一個8 bit的灰度圖像,P={0…255})。把圖像分割成像素接近的N個組:{x1…xn},定義一個辨別函數f:
則每一個像素組G=(x1…xn)對應一個實數值f(x1…xn)∈R。像素組G的噪聲越大,辨別函數f的值就越大。而LSB的信息嵌入等同于疊加了噪聲,這樣會引起f值的增加。
定義一個基于集合P的可逆操作F,稱之為翻轉。翻轉可以認為是一個灰度級的置換,它具有以下性質:
對x∈P有F2=F和F(F(x))=x。
對于8 bit灰度圖像,定義翻轉如下:
為保持完備性,還定義一個恒等翻轉:
F0(x)=x
以上翻轉都滿足:
F-1(x)=F1(x+1)-1 x∈P(2)
用辨別函數f和翻轉操作F就可以將G歸類到三種類型的像素組:R(規則組)、S(奇異組)、U(無用組),分類規則如下:
用Rm來表示處理后的規則組的數量,Sm表示異常組的數量,上述翻轉等同于模擬疊加了噪聲,導致了f值的增加,因此規則組的總數將大于異常組,即:
Rm>Sm(3)
如圖1所示,隨著隱藏信息長度的增加,當嵌入率為50%時,Rm和Sm的值趨于相等。
此外,大量的試驗表明下面的統計假設都是正確有效的:
RS隱寫分析正是建立在式(4)的統計假設之上,再利用式(3)來判斷是否有信息嵌入,最后利用二次方程(5):
2(d1+d0)x2+(d-0-d-1-d1-3d0)x+d0-d-0=0(5)
其中:d0=Rm(p/2)-Sm(p/2)
d1=Rm(1-p/2)-Sm(1-p/2)
d-0=R-m(p/2)-S-m(p/2)
d-1=R-m(1-p/2)-S-m(1-p/2)
x的取值為兩個根中絕對值小的那一個,代入式(6)可得出嵌入信息的長度P:
P=x/(x-1/2)(6)
3.2 算法改進
基于RS算法的改進方法,可以分為以下幾個步驟:
(1)將圖像看成是一個M×N的像素組,將其分成n個小的像素組,每個組的元素個數根據情況指定。
(2)對每個小的像素組進行式(1)的f運算。
(3)對每個小的像素組進行正翻轉,翻轉規則為:像素值為偶,其值加1;像素值為奇,其值減1。
(4)對翻轉后的小像素組重復步驟(2),比較未翻轉的像素組和翻轉后的像素組的f運算后的值,如果翻轉后的值大于翻轉前的值,就將該像素組歸為R類,反之歸為S類,相等則歸為U類。
(5)對每個小的像素組進行負翻轉,翻轉規則為:像素值為偶數則減1,奇數則加1,然后重復步驟(4)。
(6)對原始圖像整體翻轉,規則為:像素值為偶數則加1奇數則減1,對得到的新像素組重復步驟(1)~(5)。
(7)將上面得到的多個情況下的R、S組的數量代入到上面二元方程(5)中求解,由等式(6)就可以得到P值。根據大量實驗數據設定了一個閾值為5%,一般P值大于5%就可以認為圖像中含有隱藏信息。
上述的步驟(3)和(5)在一定程度上減小了RS檢測算法對統計假設的依賴性,步驟(6)對圖像的整體反轉,使得在不改變像素間相關特性的同時,可以對圖像進行了二次檢驗,增加了判決結果的準確性。
3.3 實驗結果和分析
通過以上RS算法的改進,基于數字圖像處理[5],利用VC編寫了一個基于RS隱寫檢測算法的檢測工具,該工具可用于檢測BMP格式的灰度和彩色圖像中是否含有隱藏信息,并顯示算法中用到的關鍵參數。檢測程序主界面如圖2所示,檢測參數如圖3所示。
實驗中利用了下面3個經典的信息隱藏工具:eShow、S-Tools和Hide4PGP。在檢測過程中,統計比較了用不同隱藏工具在不同的嵌入率和不同掩碼下檢測算法的有效性,如表1所示。
通過對大量實驗數據進行分析,總結了下面幾個影響檢測結果的因素:
(1)嵌入率越高,檢測的準確率越高。
(2)掩碼對檢測結果有影響。比較實驗的兩個掩碼,低嵌入率情況下,掩碼為0110時,檢測效果更好。
(3)初始偏差對檢測結果精確度有影響。初始偏差(表1中第1列數據)是指原始載體由于隨機變化而產生的微小初始非零信息長度。初始偏差可能是正或負,它限制了隱寫分析的精確度。統計數據表明初始偏差對JPEG圖像、未壓縮的圖像及高分辨率圖像來說相當低,而且彩色圖的初始偏差大于灰度圖。
(4)圖像中信息比特的位置。圖像中信息是隨機分布時,RS隱寫分析的精確度較高;而當圖像中信息集中分布在局部區域時,RS隱寫分析的精確度較低。
4 結論
本文針對LSB信息隱藏的RS檢測算法提出了改進,減少了該方法對檢測樣本原始統計假設的依賴性,并在不改變圖像元素間相關性的前提下增加了二次檢驗,提高了檢測準確率,實驗結果也印證了改進的有效性。通過比較大量實驗數據,總結了影響檢測結果的因素。由于本文的實驗是基于嵌入率大于30%的BMP圖像,因此在下一步研究中,還需要考慮多種格式和低嵌入率情況下的算法有效性,并針對文中提出的影響檢測準確性的因素來加以改進。
參考文獻
[1] 汪小帆,戴躍偉,茅耀斌.信息隱藏技術-方法與應用[M].北京:機械工業出版社,2001.
[2] FRIDRICH J, GOLJAN M, DU R. Detecting LSB steganography in color and gray-scale images[J]. IEEE Multimedia, Special Issue on Security, 2001,8(4):22-27.
[3] FRIDRICH J, DU R, MENG L. Steganalysis of LSB encoding in color Images[C]. IEEE International Conference on Multimedia and Expo, IEEE Press, N.J. 2000.
[4] NAOR M, SHAMIR A. Visual cryptography[C]. EUROCRYPT,1994:1-12.
[5] 阮秋琦.數字圖像處理學[M].北京:電子工業出版社,2001.