基于知識(shí)輔助深度強(qiáng)化學(xué)習(xí)的巡飛彈組動(dòng)態(tài)突防決策
兵工學(xué)報(bào)
頁數(shù): 16 2024-01-16
摘要: 巡飛彈組(Loitering Munition Group, LMG)突防控制決策是提高巡飛彈群組作戰(zhàn)自主性與智能性的關(guān)鍵。針對(duì)存在截?fù)魯r截器和臨機(jī)防空火力區(qū)的動(dòng)態(tài)環(huán)境中彈組突防機(jī)動(dòng)指令在線生成困難的問題,提出一種基于知識(shí)輔助強(qiáng)化學(xué)習(xí)方法的LMG突防控制決策算法。結(jié)合領(lǐng)域知識(shí)、規(guī)則知識(shí)改進(jìn)狀態(tài)空間和回報(bào)函數(shù)設(shè)計(jì)提高算法泛化能力與訓(xùn)練收斂速度。構(gòu)建基于軟動(dòng)作-評(píng)價(jià)方法的LMG突防... (共16頁)