摘 要: 分析研究了三次樣條插值算法和分段冪函數插值算法的數學原理,結合兩者的優勢,利用端點延拓技術給出了一種更為精確的數據擬合函數構造方法。并通過Matlab軟件編程實現,實驗表明分段冪函數求解包絡線的算法大大提高了EMD分解中數據擬合精度。
關鍵詞: 經驗模態分解;三次樣條插值;分段冪函數插值;包絡線
希爾伯特—黃變換HHT(Hilbert-Huang Transform)是1998年由Huang等人[1-2]提出的一種信號分析方法,它通過經驗模態分解EMD(Empirical Mode Decomposition)基于信號的局部特征時間尺度將信號分解成有限數目的本征模態函數IMF(Intrinsic Mode Functions)之和,對每個IMF進行Hilbert變換可以求得具有物理意義的瞬間頻率,非常適合對非平穩信號處理。所以許多研究學者將該技術應用于數據波的時頻分析[3-4]和時間序列的預測研究[5-6],取得了顯著的成果。
時間序列模型適合于線性時序的預測,當用于預測非線性時間序列時,準確性較差;小波分析方法中數據基本假定為平穩序列,當用于非平穩時間序列預測時準確性不高;神經網絡具有逼近非線性的能力,然而當用神經網絡來預測股價時間序列時,其結果不是很理想;中國證券市場的混沌性暗示著金融時間序列的長期不可預測性和短期預測的可行性,但混沌模型與其他方法對股市進行預測時,也未能得到令理論界和實務界較滿意的效果。在研究金融數據預測時提出了將EMD與神經網絡結合的預測模型,就是利用EMD處理非平穩數據的優勢。
在EMD過程中,最為關鍵的就是如何擬合成與原始數據逼近的函數,即構造函數的算法問題。而要想構造較為準確的函數,關鍵是包絡線的選取算法。現有的EMD分解算法一般應用三次樣條插值法,雖然能夠得到較為理想的結果,但仍然有些偏差,特別是邊緣數據(拐點)誤差較大。本文系統分析了三次樣條插值算法和分段冪函數插值算法的特點,將其結合找到一種更好的求包絡線的算法,從而提出了一種更為有效的數據擬合函數構造方法。
1 經驗模態分解(EMD)
1.1 本征模態函數性質
EMD算法的目的就是將復雜數據(信號)分解為有限個本征模態函數IMFs,這里IMF須滿足如下兩個性質:
(1)信號的極值點(極大值或極小值)數目和過零點數目相等或最多相差一個;
(2)由局部極大值構成的上包絡線和由局部極小值構成的下包絡線的平均值為零。
3.3 實驗分析
從圖1可以看出,經過分段冪函數的端點延拓處理,插值擬合的函數更接近于原始數據,大大提高了EMD中數據擬合的效果。為下一步數據分析和預測提供了技術保證。
本文在分析經驗模態分解算法的基礎上,討論了三次樣條插值求解包絡線的弊端,引入分段冪函數端點延拓技術,提高了數據擬合精度。實驗表明,對數據擬合算法的改進極大提高了EMD過程中函數擬合的效果,有利于提高時間序列分析和預測精度。
參考文獻
[1] HUANG N E, Shen Zheng, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for non-linear and non-station time series analysis[J]. Proc R SocLond,1998,45(4):903-995.
[2] HUANG N E, Shen Zheng, LONG S R. A new view of non-linear water waves. The hilbert spectrum [J]. Annual Review of Fluid Mechanics,1999,31:417-457.
[3] 蓋強.局域波時頻分析方法的理論研究與應用[D].大連:大連理工大學,2001:52-54.
[4] 徐世艷.經驗模態分解的時頻分析方法及其應用[J].吉林大學學報,2009,9(27-5):487-492.
[5] 劉慧婷,倪志偉,李建洋.經驗模態分解方法及其應用[J].計算機工程及應用,2006,32(1):44-47.
[6] 玄兆燕,楊公訓.EMD在地面氣溫預測中的應用[J].微計算機信息,2008,2(24-3):230-232.