반응형 Dron1 [DRON] Opponent Modeling in Deep Reinforcement Learning International Conference on Machine Learning, New York, NY, USA, 2016. JMLR Abstract : multi-agent setting에서 policy와 opponent action을 공동으로 학습하는 model을 제시한다.해당 논문에서는 opponent action을 DQN encoding을 통해 예측하고, 원하는 경우 multi-tasking을 사용하여 emplict modeling을 유지한다. Mixture-of-Experts architecture을 사용하여 추가 supervision 없이 opponent strategy pattern을 자동으로 발견한다. Introduction : colaborative or competitive task에.. 2022. 7. 29. 이전 1 다음 반응형