摘 要: 作為一種新的機器學習方法,支持向量機的參數選擇沒有一個統一的模式和標準。為了克服這一缺點,對遺傳算法進行改進,構造一種混沌云自適應模擬退火遺傳算法(CCASAGA)對支持向量機回歸參數進行優化。該算法將混沌優化、基于云模型的自適應控制機制和模擬退火的Metropolis準則結合起來,并采取精英保持策略加快算法的收斂速度。利用改進后的CCASAGA-SVR預測模型對某股份制銀行ATM機現金需求進行預測,并引入GA-SVR模型和BP神經網絡模型進行對比,從而證實該預測模型具有更高的預測精度。
關鍵詞: 遺傳算法;支持向量機;BP神經網絡;預測
支持向量機SVM(Support Vector Machine)最初于20世紀90年代由Vapnik等人首先提出,是一種基于統計學習理論的新型的通用學習方法[1]。支持向量機模型可以用于分類和預測。在應用支持向量機模型進行預測時,對預測精度產生重要影響的參數是:懲罰因子C、不敏感損失函數參數ε和核函數及其參數。因此,本文的預測模型需要利用遺傳算法對這3個參數進行優化以提高SVR預測模型的預測精度。標準遺傳算法SGA(Standard Genetic Algorithm)存在早熟收斂和易陷入局部最優解的缺陷,主要表現在種群中所有個體狀態趨于一致而停止進化,算法不能找到令人滿意的解。針對上述缺點,各國學者對遺傳算法的編碼方式、適應度函數的設計、遺傳算子機理等進行深入研究,提出了眾多的改進方法,包括免疫遺傳算法[2]、基于多樣化成長策略的遺傳算法[3]和模糊自適應遺傳算法[4]等。
本文在前人研究成果的基礎上,提出一種混沌云自適應模擬退火遺傳算法CCASAGA(Chaos Cloud-based Adaptive Simulated Annealing Genetic Algorithm),使用混沌映射優化遺傳算法的初始種群,采用云模型實現交叉概率和變異概率的自適應調整,引入模擬退火避免算法陷入局部最優,并采取精英保持策略,防止進化過程中產生的優秀個體模式遭到破壞,提高了算法的收斂速度。運用CCASAGA對SVR的參數進行優化,尋找到更好的參數值,從而提高模型的預測精度。
1 遺傳算法的改進
1.1 利用混沌映射優化遺傳算法初始種群
傳統遺傳算法的初始種群由隨機的方法產生,因此每次尋優效果可能不盡相同,且容易導致算法陷入局部最優。本文采用混沌映射優化遺傳算法的初始種群,利用混沌變量具有的遍歷性、隨機性和內在規律性,在一定范圍內不重復地遍歷所有狀態,從而保證種群分布均勻,具有多樣性。
3 實驗結果
3.1 實驗數據
本文數據來源于某股份制銀行某市分行ATM交易后臺數據庫中的取款數據。這里選取某臺ATM機2010年12月6日~2012年9月13日的日取款量數據作為研究樣本,樣本量的大小為648,以前643天數據為訓練集,后5天數據為測試集。模型訓練完后對后5天的ATM現金需求量進行多步預測,并在測試集上檢驗模型的預測效果。
3.2 實驗的實現和結果
整個模型算法通過MATLAB軟件編程實現,其中支持向量機的實現用到了臺灣大學林智仁教授團隊所編寫的Libsvm-3.1工具箱,對遺傳算法的改進用到了英國謝菲爾德大學開發的GATBX遺傳算法工具箱。整個模型的參數設置如表1所示。
應用前面提出的預測模型對ATM機的現金需求進行預測。首先運用改進后的遺傳算法對SVR參數進行優化,尋優過程如圖2所示。最終得到最佳的C=0.270 589,γ=9.264 51,ε=0.081 102 7。將最佳參數代入SVR模型進行訓練,得到最優的SVR預測模型,用最優模型預測后5天的現金需求量,并與測試集數據進行對比,得到最終的預測結果,如圖3所示。
將本文提出的CCASAGA-SVR模型與傳統GA-SVR模型及BP神經網絡模型[5]預測結果進行對比,如表2所示。
由表2可知,本文提出的CCASAGA-SVR模型預測精度最高,而神經網絡模型相對來說預測精度最低。本文對遺傳算法改進后,使用CCASAGA-SVR的預測誤差比GA-SVR的預測誤差降低了約1.03個百分點。然而,本身GA-SVR模型的預測平均精度也在90%以上,這一方面說明采用標準遺傳算法對支持向量回歸機進行優化也可以得到預測精度較高的預測模型,另外也說明本文對遺傳算法的改進是有效的,能夠在原來較好的預測效果上進一步提高預測精度。另外,BP神經網絡模型的總體預測精度較差,而且預測誤差波動范圍較大,這可能是由于其在訓練過程中產生了過擬合的現象,因此其泛化能力不如支持向量回歸機。
參考文獻
[1] 曹建芳,王鴻斌.一種新的基于SVM-KNN的Web文本分類算法[J].計算機與數字工程,2010,38(4):59-61.
[2] 王潔,高家全,方志民,等.一種新的免疫遺傳算法及應用[J].計算機應用與軟件,2010,27(12):89-91.
[3] 袁煜明,范文慧,楊雨田,等.一種基于多樣化成長策略的遺傳算法[J].控制與決策,2009,24(12):1801-1804.
[4] Guo Yiqiang,Wu Yanbin,Ju Zhengshan,et al.Remote sensing image classification by the chaos genetic algorithm in monitoring land use changes[J].Mathematical and Computer Modelling,2010,51(11):1408-1416.
[5] 李仿華,王愛平,姚麗娜,等.基于遺傳優化的RBF-BP 網絡的實時故障檢測[J].微型機與應用,2012,31(8):90-93.
[6] 戴朝華,朱云芳,陳維榮.云自適應遺傳算法[J].控制理論與應用,2007,24(4):646-650.