摘 要: 提出一種用于室內環境下人形機器人的實時導航系統。首先基于顏色特征,把單目圖像的像素點分類為地面和障礙物,并對各個障礙物的像素點進行聚類,以選擇出它們最底部的像素點作為特征點。然后基于SVM(Support Vector Machine)算法,構造攝像頭中實際點和像素點坐標的映射關系,并用均值場理論輔助SVM的學習過程。根據映射關系和特征像素點,就可以估計出障礙物與機器人的距離。最后根據距離信息,在離散化的運動空間中,一步一步規劃出機器人的行走路徑。在人形機器人DARWIN上對提出的方法進行了實現,實驗結果顯示了該方法的有效性。
關鍵詞: 人形機器人;導航;顏色信息;支持向量機;路徑規劃
0 引言
近年來,研究人員對人形機器人開展了大量研究工作,并取得了巨大進步。人形機器人的機械結構使得它們更適合人類的生活環境,比如家里和辦公室等室內環境。而人形機器人能自由行動的關鍵在于其自主導航能力。人形機器人的自主導航涉及很多基礎研究領域,比如計算機視覺、人工智能、運動規劃等。
目前,已有一些針對不同硬件平臺的人形機器人的自主導航方法。陳衛東等人[1]將障礙物和目標的位置信息模糊化,建立模糊規則并對其求解以實現自主導航;CHESTNUTT J等人[2]為Honda ASIMO人形機器人設計了腳步規劃器,基于有限的狀態獨立行為,使用A*算法搜索最優腳步序列; ZANNATHA J M等人[3]設計了人形足球機器人的視覺自定位系統,通過圖像處理算法及幾何分析,進行3D單目重建,估計機器人在球場內的位置和方向;WANG Y T等人[4]實現了人形機器人的定位和建圖,其使用SURF進行圖像特征檢測和選擇,并基于擴展的卡爾曼濾波繼續圖像深度計算和特征狀態估計;BALTES J等人[5]以視覺信息作為反饋,使用粒子濾波對機器人定位,據此規劃出機器人的行走路徑。
前人的工作中較多采用的是雙目視覺系統,或者配合聲納等設備,雖然這樣能使測量和控制更加精準,但機器人的體積及質量往往較大。由于單目攝像頭成本較低、結構簡單,越來越多的機器人用其作為自主導航檢測系統的傳感器。本文針對配置一個攝像頭的人形機器人以及在室內地面行走的任務,設計了一個實用的實時導航系統,此系統使機器人在實驗環境中能夠從當前位置到達預定的目的地。本文的工作為基于單目的人形機器人在更加復雜的環境中順利行走奠定了基礎。
1 系統概述
此導航系統分為3部分,分別為障礙物的檢測、障礙物的定位和機器人路徑規劃。
檢測障礙物時,基于顏色特征,把單目圖像中的所有像素點分類為地面和障礙物。對屬于障礙物的像素點進行聚類,以區分開不同的障礙物。選擇每個障礙物最底部的像素點作為此障礙物的特征點,用于估計此障礙物和機器人之間的相對位置。
定位障礙物時,先用SVM(Support Vector Machine)算法構造攝像頭中實際點和像素點坐標的映射關系,并用均值場理論來輔助SVM的學習過程。基于此映射關系,還原出特征像素點的3D信息,就可以估計出障礙物與機器人的距離。
根據機器人的行走特點,離散化機器人的運動空間,然后根據距離信息,一步一步規劃出機器人的行走路徑。
2 系統設計描述
2.1 障礙物檢測
機器人在自主運動的過程中,需要避開地面上的障礙物。可對機器人行走的室內地面環境進行一些合理假設:地面平坦且顏色一致;障礙物都在地面上沒有懸空;障礙物的顏色與地面的顏色不同;障礙物的形狀比較簡單且有規則。
本文選擇顏色特征作為識別障礙物的主要線索。使用機器人的攝像頭對機器人行走的地面進行多次隨機采樣,以獲取較完備的地面參考信息。將攝像頭輸出的RGB顏色空間的圖像轉換到HIS顏色空間,計算出所有地面采樣圖像的平均色調和強度直方圖,并用簡單均值濾波器進行濾波處理。
機器人行走時,用5×5高斯濾波器對輸入圖像進行濾波,以降低圖像中的噪聲。將過濾后的圖像轉換到HIS顏色空間。
將圖像中的每個像素的色調、強度與參考數據相比較,如果滿足以下兩個條件之一,則該像素被判定屬于障礙物:(1)該像素色調值在直方圖中的頻數低于某個閾值;(2)該像素強度值在直方圖中的頻數低于某個閾值。
基于前文所描述的方法,對圖1(a)中地面上的圓柱體進行識別,識別結果如圖1(b)為所示,此實驗驗證了障礙物檢測方法的有效性。
2.2 障礙物定位
識別出視野內地面上的障礙物后,還需要弄清障礙物和機器人的相對位置,才能進一步確定機器人的行走方向。根據前文的假設,由于障礙物都比較簡單且有規則,可以選擇障礙物最底部的點作為障礙物的特征點,用于度量障礙物和機器人的距離。
對單攝像頭采集的2D圖像,無法直接得到其中的像素點對應實際點的真實坐標,需要建立它們之間的映射關系。本文利用SVM[6]回歸分析,求得攝像頭模型參數。均值場理論[7]用于輔助SVM算法的學習過程。
本文采用針孔透視投影模型,假設真實點M(X,Y,Z)對應圖像像素點m(x,y),用式(1)表示這種投影關系:
式(1)的圖形化表示如圖2所示,可以看出,3個輸出分支之間存在耦合,因此無法對其單獨優化。
使用線性核的SVM回歸規則表示輸出為:
為克服回歸輸出之間存在的耦合問題,在優化支持向量回歸機時,可以使用梯度下降法對伸縮因子s進行優化。
用放置在地面上的黑白相間的方格棋盤來構造訓練數據集和測試數據集,以機器人在地面投影的中心為原點構造真實世界坐標系,如圖3所示。選擇方塊的角作為特征點,用其中60個點的數據作為訓練數據,另外20個點的數據作為測試數據。可以通過角點檢測計算出所有特征點的像素坐標。對被選入訓練集合的特征點,它們在坐標系O-xyz中的3D坐標為輸入,它們所對應的像素點在圖像平面上的像素坐標為輸出。
給定伸縮因子初始值后,就可以開始訓練映射函數。用平均場方法優化圖3中的回歸分支,用梯度下降法更新伸縮因子,重復這兩個過程直到式(4)達到最小。
訓練結束后,投影矩陣的估計值為:
測試時,輸入測試集中特征點的像素坐標,得到對應真實坐標的估計值,3D重建的準確度用均方根誤差來衡量:
其中,對本文所采用的測試集,RMSE=0.568 mm,表明模型的準確性較高。
2.3 路徑規劃
機器人的運動機制比較復雜,使得其路徑規劃也很困難,一種簡單的處理辦法就是離散化機器人的運動空間。針對機器人的機械結構及步態特點,本文為人形機器人設計了一種樹形路徑規劃算法。對機器人的下一個位置,設計了5種不同的選擇,如圖4所示。
對每個位置,由式(7)計算出一個值,作為選擇下一個位置的依據:
其中,j∈{1,2,…,5},dmax為距離的最大值,本文中取dmax=300 cm。
計算出每個位置對應的fj后,再根據式(8)確定下一個位置的最優選擇:
在圖4中,此位置為m3。當機器人到達下一位置后,不斷重復以上路徑規劃過程直到機器人走到目的地。
3 實驗結果
本文以韓國ROBOTIS公司制造的小型人形機器人DARWIN為驗證平臺,對所提出的導航方法進行了實現。實驗場景如圖5(a)所示,地面上的紅色小球為目標地點,行進的路徑上有4個障礙物。
圖5(a)、(b)分別為機器人在起點處的場景圖和視野圖,機器人看到預設的4個障礙和兩個目標小球;圖5(c)、(d)分別為機器人到達第一個目標地點處的場景圖和視野圖,機器人避開障礙物并準確到達目的地,此時視野中還有兩個預設的障礙物以及一個目標小球;圖5(e)、(f)為機器人到達第二個目標地點處的場景圖和視野圖,機器人依然成功避開障礙物并準確到達目的地,此時視野中無目標,機器人停止行走。
機器人順利完成設定的避障導航任務,驗證了本文所述方法的有效性。
4 結論
本文為小型人形機器人提出一種實用的實時導航系統。此系統包括3部分:(1)基于顏色特征的障礙物檢測系統;(2)基于SVM的障礙物定位系統;(3)基于運動空間離散化的樹形路徑規劃系統。障礙物檢測系統通過區別障礙物和地面的顏色特征,能夠比較準確地識別出在給定地面上的有別于地面顏色的障礙物,并選擇出用于計算障礙物和機器人距離的特征點。經過訓練的障礙物定位系統對測試數據表現良好,能夠比較精確地根據圖像中的像素坐標還原出對應實際點的真實坐標。樹形路徑規劃方法將機器人的運動空間離散化為樹形結構,能根據當前障礙物和機器人的相對位置關系,從當前位置節點的子節點中選擇下一個行進位置,使機器人一步一步抵達目標位置。在DARWIN機器人上實現了整個系統,并通過實驗驗證,機器人順利避開障礙物到達設定的目標位置,顯示了本文方法的有效性。
參考文獻
[1] 陳衛東,朱奇光.基于模糊算法的移動機器人路徑規劃[J].電子學報,2011,39(4):971-974,980.
[2] CHESTNUTT J, LAU M, CHEUNG G, et al. Footstep planning for the Honda ASIMO humanoid[C]. Proceedings of the 2005 IEEE International Conference on Robotics and Automation, ICRA 2005, IEEE, 2005:629-634.
[3] ZANNATHA J M I, CISNEROS LIM?魷N R, G?魷MEZ S?譧NCHEZ A D, et al. Monocular visual self-localization for humanoid soccer robots[C]. 2011 21st International Conference on Electrical Communications and Computers,. IEEE, 2011:100-107.
[4] WANG Y T, HUNG D Y, CHENG S H. Monocular SLAM for a small-size humanoid robot[J]. Tamkang Journal of Science and Engineering, 2011, 14(2): 123-129.
[5] BALTES J, CHENG C T, LAU M C. Real-time navigation for a humanoid robot using particle filter[J]. Applied Mechanics and Materials, 2013, 284: 1914-1918.
[6] VAPNIK V. The nature of statistical learning theory[M]. New York: Springer, 1995.
[7] OPPER M, WINTHER O. Gaussian processes for classification: mean field algorithms[J]. Neural Computation, 2000,12(11):2655-2684.