被動(dòng)探測(cè)視場(chǎng)角約束下的深度強(qiáng)化學(xué)習(xí)制導(dǎo)方法
宇航學(xué)報(bào)
頁數(shù): 9 2024-08-30
摘要: 針對(duì)紅外制導(dǎo)導(dǎo)彈攔截機(jī)動(dòng)目標(biāo)的導(dǎo)引律設(shè)計(jì)問題,提出了一種純角度量測(cè)下考慮視場(chǎng)角約束的深度強(qiáng)化學(xué)習(xí)制導(dǎo)方法。首先,將攔截制導(dǎo)問題轉(zhuǎn)化為一個(gè)馬爾可夫決策過程,建立了基于雙延遲深度確定性策略梯度算法的深度強(qiáng)化學(xué)習(xí)制導(dǎo)模型,并充分考慮了導(dǎo)彈一階自動(dòng)駕駛儀特性;其次,設(shè)計(jì)了一種滿足導(dǎo)引頭視場(chǎng)角約束,同時(shí)又能權(quán)衡能量消耗和制導(dǎo)精度的綜合獎(jiǎng)勵(lì)函數(shù),并在典型場(chǎng)景下進(jìn)行了深度強(qiáng)化學(xué)習(xí)制導(dǎo)律訓(xùn)練。... (共9頁)