반응형 VDN1 [VDN] Value-Decomposition Networks For Cooperative Multi-Agent Learning [Submitted on 16 Jun 2017] Abstract : single joint reward signal을 사용하여 cooperative multi-agent RL problem을 연구한다. fully centralized and decentralized approach에서 가짜 reward problem과 partial observability로 인해 발생하는 'lazy agent' 현상을 찾는다. team value function을 개별 agent value function으로 분해하는 network architecture로 개별 agent를 학습시키는 method를 제안한다. Introduction : 원칙적으로 cooperative MARL problem은 centralized app.. 2022. 8. 20. 이전 1 다음 반응형