多智能體深度強(qiáng)化學(xué)習(xí)研究進(jìn)展
計(jì)算機(jī)學(xué)報(bào)
頁(yè)數(shù): 21 2024-04-19
摘要: 深度強(qiáng)化學(xué)習(xí)(Deep Rcinforcement Lcarning,DRL)在近年受到廣泛的關(guān)注,并在各種領(lǐng)域取得顯著的成功.由于現(xiàn)實(shí)環(huán)境通常包括多個(gè)與環(huán)境交互的智能體,多智能體深度強(qiáng)化學(xué)習(xí)(Multi-Agent Deep Reinforcement Lcarning,MADRL)獲得蓬勃的發(fā)展,在各種復(fù)雜的序列決策任務(wù)上取得優(yōu)異的表現(xiàn).本文對(duì)多智能體深度強(qiáng)化學(xué)習(xí)的工作進(jìn)展... (共21頁(yè))