《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于深度強化學習和社會力模型的移動機器人自主避障
基于深度強化學習和社會力模型的移動機器人自主避障
網絡安全與數據治理 2023年3期
李恒,劉輕塵,馬麒超
(中國科學技術大學信息科學技術學院,安徽合肥230026)
摘要: 深度強化學習在移動機器人自主避障領域已得到廣泛應用,其基本原理是通過模擬環境中的不斷試錯,結合獎勵機制提升機器人的避障性能。然而,針對不同任務場景,網絡訓練效率存在顯著差異。同時,在人群密集的場景中,機器人的行為可能對人類造成干擾。為了應對訓練效率低下和機器人行為不符合社會規范的問題,提出了一種將社會力模型融入深度強化學習的自主避障策略。該策略首先將人類未來的運動軌跡考慮進獎勵函數,以確保機器人理解人類意圖并避免闖入人類的舒適區。其次,在訓練過程中引入先驗的傳統控制器模型,并設計了一種基于概率的切換開關,以隨機切換控制器輸出,提高機器人的探索效率。實驗結果表明,所提出的方法能夠增加機器人與人類之間的安全距離,同時實現平穩導航。
中圖分類號:TP273
文獻標識碼:A
DOI:10.19358/j.issn.2097-1788.2023.03.011
引用格式:李恒,劉輕塵,馬麒超.基于深度強化學習和社會力模型的移動機器人自主避障[J].網絡安全與數據治理,2023,42(3):68-73,79.
Autonomous obstacle avoidance for mobile robots based on deep reinforcement learning and social force model
Li Heng,Liu Qinchen,Ma Qichao
(School of Information Science and Technology, University of Science and Technology of China, Hefei 230026, China)
Abstract: Deep reinforcement learning has been widely applied in the field of mobile robot autonomous obstacle avoidance Its basic principle is to simulate continuous trialanderror in the environment and improve the robot’s obstacle avoidance performance by combining reward mechanisms However, the training efficiency of the network varies significantly depending on the task scene, and in crowded scenes, the robot’s behavior may cause interference with humans To address the problems of low training efficiency and robots behaving inappropriately, this paper proposes a selfobstacle avoidance strategy that incorporates the social force model into deep reinforcement learning The strategy firstly considers the future trajectory of humans in the reward function to ensure that the robot understands human intentions and avoids entering the human comfort zone Secondly, during the training process, a priori traditional controller model is introduced and a probabilitybased switching method is designed to randomly switch controller outputs to improve the robot’s exploration efficiency The experimental results show that the proposed method can increase the safety distance between the robot and humans while achieving smooth navigation.
Key words : eep reinforcement learning; social force model; autonomous obstacle avoidance

0    引言

自主避障是移動機器人應用中的基礎技術,其可以確保機器人在機場和購物中心等人流擁擠場景中實現安全導航。人類有觀察他人以調整自身行為的能力,因此可以輕松穿過人群。然而,在高度動態和擁擠的場景中進行自主避障仍然是移動機器人的一項艱巨任務。傳統導航框架中的避碰模塊通常將動態障礙物視為靜態,例如動態窗口方法(DWA),或者僅根據某些交互規則關注下一步行動,例如互惠速度障礙(RVO)和最優互惠碰撞避免(ORCA)。由于這些方法僅通過被動反應防止碰撞,并且通常使用人為定義的函數以保證安全,因此會導致機器人的運動不自然、短視和不安全。相比之下,強化學習導航技術可以通過不斷地探索和學習增強機器人的感知能力,從而實現更有力的決策。




本文詳細內容請下載:http://m.xxav2194.com/resource/share/2000005258




作者信息:

李恒,劉輕塵,馬麒超

(中國科學技術大學信息科學技術學院,安徽合肥230026)


微信圖片_20210517164139.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 色综合综合在线| 99视频精品全部在线播放| 欧美巨大xxxx做受中文字幕| 又色又爽又黄的三级视频在线观看| 亚洲综合第一区| 天堂亚洲国产日韩在线看| 久久久久亚洲精品无码蜜桃| 欧美特黄a级高清免费大片| 厨房切底征服麻麻| 91手机看片国产永久免费| 国产麻豆精品一区二区三区V视界| 中文国产成人精品久久app| 日韩欧美亚洲视频| 亚洲成色www久久网站| 穿长筒袜的有夫之妇hd中文| 国产亚洲情侣一区二区无| 在线观看永久免费| 夜爽爽爽爽爽影院| 两根一进一出啊灌满了视频| 日韩欧美国产成人| 亚洲免费黄色网| 深夜爽爽福利gif在线观看| 午夜老司机福利| 边摸边脱吃奶边高潮视频免费 | 97色在线观看| 差差漫画在线登录入口弹窗页面 | 久久精品国产99国产精品澳门| 欧美日韩在线影院| 偷自视频区视频真实在线| 色噜噜狠狠一区二区三区果冻 | 国产成人精品动图| 88av视频在线| 大胸妈妈的朋友| 一级毛片恃级毛片直播| 日本55丰满熟妇厨房伦| 五月天婷亚洲天综合网精品偷| 欧美日韩精品一区二区三区高清视频 | 日本护士xxxx视频| 亚洲av无码成人精品区狼人影院| 欧美综合第一页| 伦理eeuss|