聯合隨機性策略的深度強化學習探索方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優于DDPG算法。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 久久久久亚洲AV无码专区桃色| 免费观看激色视频网站(性色) | 中文字幕黄色片| 欧美日韩亚洲电影网在线观看| 可以免费观看一级毛片黄a| 日本免费xxxx色视频| 大陆少妇xxxx做受| 中文字幕日韩精品麻豆系列| 欧美a级黄色片| 人妻互换一二三区激情视频| 色噜噜狠狠色综合成人网| 国产精品久久久久久久久久久搜索 | 丰满爆乳无码一区二区三区| 欧美人与动牲高清| 伊人中文字幕在线观看| 色偷偷www8888| 国产成人yy免费视频| 538精品视频| 天天色综合天天| 中文字幕在线免费看线人| 日韩精品在线观看视频| 亚洲欧美日韩久久精品第一区| yy4080私人影院6080青苹果手机| 曰批免费视频播放在线看片二| 亚洲精品人成电影网| 精品无人乱码一区二区三区 | 欧美理论片在线观看一区二区| 内射毛片内射国产夫妻| 艾粟粟小青年宾馆3p上下| 国产无遮挡裸体免费视频 | 大学生粉嫩无套流白浆| 中文乱码人妻系列一区二区| 日韩亚洲av无码一区二区不卡| 亚洲人成网站18禁止久久影院| 波多野结衣一区二区三区四区| 免费观看黄网站| 美女洗澡一级毛片| 国产亚洲欧美日韩精品一区二区 | 中国女人内谢69xxx| 日本伊人色综合网| 么公的又大又深又硬想要|