《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于卷積神經網絡的智能冰箱果蔬圖像識別的研究
基于卷積神經網絡的智能冰箱果蔬圖像識別的研究
2017年微型機與應用第8期
曾維亮1,林志賢1,陳永灑2
1.福州大學 物理與信息工程學院,福建 福州 350116;2.TCL集團工業研究院,廣東 深圳 518055
摘要: 智能冰箱物體識別主要涉及對水果和蔬菜的識別,冰箱中果蔬數量繁多,光照不均,環境復雜,對此提出了一種用于處理該類識別問題的卷積神經網絡。網絡采用ReLU作為激活函數,它比傳統的Sigmoid函數具有更強的稀疏能力和更大的梯度值,能夠極大地加速網絡收斂。隱含層中引入隨機Dropout,使得某些節點不工作,減少節點間的“共同適應”,降低網絡對某一局部特征的過擬合,可減少網絡計算復雜度并有效提升識別率。網絡采用帶動量項的基于梯度下降的反向傳播算法,避免網絡陷入局部極小值,提高識別率。最后通過用Supermarket Produce Dataset數據集模擬冰箱果蔬圖像進行實驗,驗證了本文方法的有效性。
Abstract:
Key words :

  曾維亮1,林志賢1,陳永灑2

 ?。?.福州大學 物理與信息工程學院,福建 福州 350116;2.TCL集團工業研究院,廣東 深圳 518055)

        摘要:智能冰箱物體識別主要涉及對水果和蔬菜的識別,冰箱中果蔬數量繁多,光照不均,環境復雜,對此提出了一種用于處理該類識別問題的卷積神經網絡。網絡采用ReLU作為激活函數,它比傳統的Sigmoid函數具有更強的稀疏能力和更大的梯度值,能夠極大地加速網絡收斂。隱含層中引入隨機Dropout,使得某些節點不工作,減少節點間的“共同適應”,降低網絡對某一局部特征的過擬合,可減少網絡計算復雜度并有效提升識別率。網絡采用帶動量項的基于梯度下降的反向傳播算法,避免網絡陷入局部極小值,提高識別率。最后通過用Supermarket Produce Dataset數據集模擬冰箱果蔬圖像進行實驗,驗證了本文方法的有效性。

  關鍵詞:卷積神經網絡;果蔬識別; Dropout;梯度下降

  中圖分類號:TP391.4文獻標識碼:ADOI: 10.19358/j.issn.1674-7720.2017.08.018

  引用格式:曾維亮,林志賢,陳永灑.基于卷積神經網絡的智能冰箱果蔬圖像識別的研究[J].微型機與應用,2017,36(8):56-59.

0引言

  *基金項目:國家重點研發計劃課題(2016YFB0401503);福建省科技重大專項(2014HZ00031);廣東省科技重大專項(2016B090906001);福建省資助省屬高校專項課題(JK2014002)智能冰箱的果蔬識別可收集用戶果蔬產品的消耗情況,利用該數據分析出用戶喜好,商家可通過終端APP適時向用戶做出果蔬產品推薦,或提醒用戶盡快食用即將過期的食品。目前智能冰箱的物體識別方法主要有:用戶手動輸入或語音輸入食物種類、無線射頻識別掃描[1]、條形碼或二維碼掃描[2]等技術。針對果蔬圖像識別,BOLLE R M等人[3]等通過提取圖像的顏色、紋理統計特征,首次實現了隨意擺放農產品的識別與分類。ROCHA A等人[4]比較了和差直方圖(Unser)、顏色聚合向量(Color Coherence Vector,CCV)、內外點顏色直方圖(Border/Interior pixel Classfication,BIC)等紋理、顏色特征,采用Kmeans與自底向上聚類(Bottomup Clustering Procedure)方法對這幾類特征進行識別,同時指出采用特征融合的辦法可以取得更好的效果,但是該方法不能很好地表現果蔬紋理的差異性,且對外界光照較敏感。Zhang Yudong等人提出利用Unser、RGB顏色直方圖、外形等作為識別特征,采用多核SVM進行果蔬產品識別[5],取得了較好的識別效果,但是多核支持向量機訓練時間長,成本較大。ROCHA A等人[6]后期繼續采用特征融合的方法對果蔬識別技術進行了優化。陶華偉等人[7]提出一種基于顏色完全局部二值模式來提取物體紋理特征的方法,提高了智能果蔬系統的識別率。以上對果蔬圖像識別的研究均屬于人工提取特征的范疇。

  LECUN Y等人[8]提出的LeNet5卷積神經網絡在數字識別中取得了巨大的成功,隨后以該模型為代表的卷積神經網絡被應用到車牌識別、手寫數字識別、視頻人體動作識別[9]、人臉特征點的檢測[10]等眾多領域。KRIZHEVSKY A等人[11]提出的網絡模型在ImageNet數據集上達到了83.6%的識別率,更是引起了廣泛的關注。李思雯等人[12]利用集成的卷積神經網絡識別智能冰箱果蔬種類,但是融合多個模型的方法比較復雜、參數較多,容易出現“過擬合”。本文提出一種用于識別冰箱果蔬種類的卷積神經網絡,網絡采用ReLU做為激活函數,避免出現飽和狀態,加速網絡收斂。而在隱含層加入隨機Dropout,使得網絡結構更加“稀疏”,減少了神經元的相互依賴性。卷積神經網絡對特定的遮擋、光照、平移、旋轉、縮放及其他形式的扭曲都具有良好的魯棒性,非常適合用于處理該類果蔬識別問題,因此成為了近年該方向的研究熱點。

1卷積神經網絡

  卷積神經網絡是可以直接以2D圖像作為輸入的深度神經網絡,它主要包括特征提取和分類器兩部分。特征提取模塊由卷積層和降采樣層交替組成,卷積層通過卷積濾波的方式獲取圖像的有用特征,降采樣層通過對卷積層的數據采樣降維,減少了數據處理量。這種從隱含層逐層地自主選取圖像由邊、顏色等低層到角點、形狀等高層特征的方式,避免了人工提取特征的繁瑣與片面,使網絡具有自主選取特征并進行學習與識別的能力。最后利用分類器對提取到的特征進行識別分類,分類器通常使用一層或兩層的全連接神經網絡實現。

  1.1LeNet-5網絡模型

  經典的LeNet5模型由輸入層、兩層卷積層、兩層降采樣層、兩層全連接網絡以及輸出層組成,LeNet5網絡模型結構如圖1所示。

001.jpg

  在卷積層中,輸入圖像通過j個不同的卷積核卷積,生成j個不同的特征圖,運算過程如式(1)所示。

  (H_)789ED52WR)IY4DG]`CH.png

  式中,xlj表示在l層(卷積層)的第j個特征圖,f(·)表示激活函數,Mj代表輸入圖像的集合,b代表偏置因子。

  降采樣層的運算過程如式(2)所示。

  N~UOHW(B_PTSU42RH3XF%S6.png

  式中:down(·)表示mean pooling降采樣,即輸入圖像中每個不同的n×n區域求和再求平均作為輸出圖像的一個點,使得輸出圖像在不同維度都縮小為原來的1/n。每個輸出圖像都有不同的乘積因子β以及偏置因子b。

  分類器的第一層是與上層降采樣層的所有特征圖全連接的卷積層,因輸入大小為5×5,而卷積核的大小也為5×5,故可以看作是全連接層。分類器第二層計算輸入向量和權重之間的點積,然后通過激活函數最終產生輸出層單元的一個狀態,決定識別結果。

  1.2基于ReLU激活函數的卷積神經網絡

  卷積神經網絡中常見的激活函數包括Sigmoid函數f(x)=(1+e-x)-1和雙曲正切函數f(x)=tanh(x),這兩種函數均屬于飽和非線性函數,收斂速度較慢。本文采用非飽和線性修正單元(Rectified Linear Units,ReLU),即f(x)=max(x),該函數通過線性修正的方式,強制某些數據為零,使得模型具有適度的稀疏表達。ReLU函數梯度值大,在反向傳播階段,能夠防止梯度傳播到前幾層網絡時彌散消失,性能比傳統的激活函數優良,并且ReLU的單邊抑制更符合生物學的觀點,其連接網絡的過程如圖2所示。

002.jpg

  1.3基于隨機Dropout的CNN網絡

  卷積神經網絡模型在訓練階段受樣本庫容量影響大,在樣本數量有限的情況下要防止模型出現“過擬合”。本文網絡結構引入隨機Dropout,即隨機“凍結”某些神經元,在網絡訓練過程中保留其當前的權值,同時將輸出設定為0,而這些被選擇的神經元在下次訓練過程中又會恢復之前保留的取值,并再次隨機選擇部分神經元重復此過程。隨機Dropout可以避免每兩個神經元同時產生作用,從而使權值的更新不再依賴于有固定關系隱含節點的共同作圖3加入Dropout的

  隱含層示意圖用,即神經網絡的結構在每次訓練過程中都發生變化。這種方式降低了神經元之間的依賴,有效提高了神經網絡的泛化能力,因此能學習到魯棒性更強的特征。本文隨機設定兩個卷積層的30%的神經元輸出為零,如圖3所示。

003.jpg

  1.4帶動量因子的梯度下降反向傳播算法

  本文訓練過程中網絡的權值更新基于帶動量因子的梯度下降反向傳播算法,權重更新規則如式(3)、(4)所示。

  vi+1=αvi-ληωi-η(Lω│ωi)Di(3)

  ωi+1=ωi+vi+1(4)

  式中:i為迭代次數;η為學習率;λ為權重衰減因子;ω表示權重向量;α為動量項,增加動量項的目的是為了避免網絡訓練陷于較淺的局部極小值點,并且能夠加快網絡收斂的速度;η(Lω│ωi)Di為第i批訓練樣本Di的損失函數在權值為ωi時關于ω的導數的平均值。

  1.5本文的卷積神經網絡模型

  本文卷積神經網絡結構如圖4所示,分別為輸入層、兩層卷積層、兩層降采樣層、全連接層、輸出層。卷積:輸入圖像經過一個可訓練的濾波器進行卷積,得到卷積層的特征圖。降采樣:對卷積層的特征圖中每個2×2的鄰域求平均得到降采樣層的一個值,因此降采樣層的特征圖在各個維度都縮小為卷積層特征圖的1/2。全連接:將最后一層降采樣層的特征圖展開成一個向量,乘上加權并通過激活函數得到輸出層神經元。

  

004.jpg

  網絡模型各層采用的參數如表1所示。

007.jpg

2實驗及結果分析

  2.1數據集

  冰箱中果蔬種類、數量繁多,擺放無規則,果蔬視角多變,光照不均,情況十分復雜。采用Supermarket Produce Dataset[10]數據集模擬冰箱獲取的圖像進行實驗,該數據集共有15類、2 633張冰箱中常見果蔬的圖像,每類果蔬圖像數量為75~264張不等,圖像尺寸為1 024×768。為了使各類圖像數據整齊并相對均衡,采取隨機復制的方式使得數據集的幾類果蔬增加了167張圖像,并在這些圖像中加入高斯白噪聲。因此修正的數據集共有15類、2 800張果蔬圖像,分別為土豆(黃)、土豆(紅)、腰果、小毛桃、富士蘋果、青蘋果、香瓜、獼猴桃、油桃、洋蔥、橘、李子、梨、青桔、西瓜。

  2.2實驗方法

004.jpg

  本文構建了如圖4所示的卷積神經網絡模型,各層的參數如表1所示。輸入圖像尺寸為28×28,因此應先將圖像裁剪并等寬高地縮小為1∶1的尺寸,等寬高地縮小是為了防止圖像畸變而丟失重要特征信息。采用批量隨機梯度下降法(Minibatch Stochastic Gradient Descend,Minibatch SGD)迭代200次(200 epochs),對每次epoch,每輸入10個樣本訓練后,進行反向傳播并更新一次權值。本文設定學習率η的初始值為0.1,待識別率沒有顯著上升或者上升趨勢變慢時,將學習率η變為原來的1/2;動量項α設值為0.6;權重衰減因子λ設為0.000 5;實驗采用留出法(holdout)劃分數據集,隨機選取2 240張圖像作為訓練集,其余的560張作為測試集。

  2.3實驗結果與分析

  2.3.1各類果蔬識別的混淆矩陣

  圖5為本文方法測試各類果蔬識別正確率的混淆矩陣。矩陣對角線位置顏色較深方塊中的數據為Y軸對應果蔬的識別率,其余較淡色方塊的數據為Y軸對應果蔬被錯誤識別為X軸對應的果蔬的識別率。從混淆矩陣中可以看出獼猴桃易被誤識別為青蘋果,梨易被誤識別為土豆(黃)。從數據集圖像中可發現這幾類水果客觀上外形比較相似;其余腰果、洋蔥、富士蘋果,香瓜、洋蔥、橘、李子、青桔等識別率較高,特別地香瓜和橘能夠達到100%的正確率。即本文的卷積神經網絡模型和參數對該類果蔬識別問題能達到一個較好的識別效果。

005.jpg

  2.3.2采用Sigmoid和ReLU做為激活函數的識別率對比圖

  圖6為網絡采用Sigmoid函數和ReLU函數迭代200次的收斂速度對比圖,其中實線為ReLU激活函數的識別率曲線,點實線為Sigmoid激活函數的識別率曲線。從圖中可以發現采用ReLU函數前期收斂速度更快;網絡趨于穩定時,采用ReLU激活函數的整體識別率約為83.4%,遠高于Sigmoid函數的識別率67.7%,因其能夠有效地防止網絡出現“過擬合”,故能夠在較大程度上提高果蔬的識別率。

  

006.jpg

  2.3.3網絡加入隨機Dropout與否的識別率對比圖

  圖7分別為網絡加入隨機Dropout與否的200次迭代后的識別率曲線圖,其中實線為加入隨機Dropout比例為30%時得到的識別率曲線,點實線為未加入Dropout的識別率曲線。網絡趨于穩定時,加入隨機Dropout的整體識別率約為83.4%,未加入隨機Dropout的整體識別率約為79.3%,識別率提高了4.1%。引入一定比例的隨機Dropout可以使得網絡更加稀疏,減少了神經元之間的共同作用,在一定程度上能夠提高果蔬的識別率,并且網絡“抖動”更小,魯棒性更強。

3結論

  本文通過構建卷積神經網絡模型對果蔬圖像進行識別,網絡采用ReLU線性函數作為神經元的激活函數,加快了網絡的收斂,提高了訓練效率及識別率。而在隱含層引入一定比例的Dropout,使網絡具有更好的泛化能力。今后將研究輸入較大的圖像尺寸,使得特征信息更加豐富,并將顏色信息加入到網絡中,研究顏色對果蔬圖像識別的影響以及在現有網絡結構上繼續改進達到提高識別率的效果,從而有效地處理該類識別問題。

參考文獻

  [1] Gu Hanshen,Wang Dong. A content-aware fridge based on RFID in smart home for homehealthcare[C].Proceedings of the 11th International Conference on Advanced Communications Technology,Beijing,IEEE,2009:987-990.

 ?。?] 戴楊,于盛林.二維條形碼編碼與譯碼的計算機實現[J].數據采集與處理,2003,18(3):356360.[3] BOLLE R M,CONNELL J H,HASS N,et al. Veggievison:a produce recognition system[P].United States:US 5546475A, 199608-13.

 ?。?] ROCHA A,HAUAGGE D C,WAINER J,et al. Automatic produce classification from images using color,texture and appearance cues[C]. 21st Brazilian Symposium on Computer Graphics and Image Processing, CampoGrande,Brazil,IEEE,2008:3-10.

 ?。?] Zhang Yudong,Wu Lenan. Classification of fruits using computer vision and multiclass support vector machine[J].Sensors,2012,12(9):1248912505.

  [6] FARIA F A,dos SANTOS J A, ROCHA A,et al. Automatic classifier fusion for produce recognition[C].25th SIBGRAPI on Graphics,Patterns and Images,OuroPreto,Brazil,IEEE,2012:20-25.

 ?。?] 陶華偉,趙力,奚吉,等.基于顏色及紋理特征的果蔬種類識別方法[J]. 農業工程學報,2014,30(16):305-311.

  [8] LECUN Y,BOTTOU L,BENGIO Y,et al.Gradientbased learning applied to document recognition[C].Proceedings of the IEEE 86,1998:2278-2324.

 ?。?] Ji Shuiwang,Xu Wei,Yang Ming,et al.3D convolutional neural networks for human action recognition [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(1):221-231.

 ?。?0] Sun Yi, Wang Xiaogang,Tang Xiaoou. Deep convolutional network cascade for facial point detection[C].2013 IEEE Conference on Computer Vision and Patten Recognition(CVPR),IEEE,2013:3467-3483.

  [11] KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[C].Advances in Neural Information Processing System 25:Proceeding of the 26th Annual Conference on Neural Information Processing Systems,Lake Tahoe,USA,2012:1097-1105.

  [12] 李思雯,呂建成,倪勝巧.集成的卷積神經網絡在智能冰箱果蔬識別中的應用[J].數據采集與處理,2016,18(3):205-212.


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 萌白酱在线17分钟喷水视频| www视频在线观看| 欧美激情综合色综合啪啪五月| 国产中文制服丝袜另类| 揄拍自拍日韩精品| 好男人社区视频在线观看| 久久精品成人一区二区三区| 永久久久免费浮力影院| 四虎免费影院ww4164h| 激情五月婷婷色| 在线成人综合色一区| 中国黄色毛片大片| 日韩欧美中文字幕出| 亚洲欧美成aⅴ人在线观看| 精品国产无限资源免费观看| 国产在线精品一区二区中文| 5555国产在线观看精品| 好男人在线社区www在线视频一 | 最新亚洲春色av无码专区 | 人人妻人人澡人人爽精品欧美| 色多多www视频在线观看免费 | 沉伦柳淑云漫画3d| 北岛玲日韩精品一区二区三区| 香蕉视频黄在线观看| 国产精品嫩草影院免费| swag合集120部| 成年美女黄网站小视频| 久久婷婷香蕉热狠狠综合| 欧美交换乱理伦片在线观看| 亚洲综合五月天欧美| 精品国产一区二区三区免费| 国产三级日产三级日本三级| 成人羞羞视频网站| 国产精品亚洲欧美大片在线看 | 青青青国产视频| 国产福利免费看| 888亚洲欧美国产VA在线播放| 奇米影视7777久久精品| 两夫妇交换的一天| 无遮挡h肉动漫在线观看日本| 久久精品国产四虎|