當(dāng)前位置:首頁 > 科技文檔 > 自動化 > 正文

基于上下文感知的強(qiáng)化學(xué)習(xí)AUV控制器研究

艦船科學(xué)技術(shù) 頁數(shù): 7 2024-06-08
摘要: 為了提升基于強(qiáng)化學(xué)習(xí)的自主水下航行器(Autonomous Underwater vehicle,AUV)控制器在復(fù)雜海況中對環(huán)境干擾的魯棒性,設(shè)計一種利用上下文信息進(jìn)行環(huán)境感知的強(qiáng)化學(xué)習(xí)控制器。結(jié)合水下機(jī)器人運(yùn)動學(xué)及動力學(xué)方程對深度跟蹤任務(wù)進(jìn)行建模,構(gòu)建了基于PPO-clip算法的深度控制器,并在算法中融入了上下文變量和域隨機(jī)化方法。在仿真環(huán)境中分別進(jìn)行海流干擾、暗涌干擾以及... (共7頁)

開通會員,享受整站包年服務(wù)立即開通 >
科技文檔