반응형 논문 리뷰51 [MADDPG] Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments Abstract : Q-learning은 env의 non-stationary로 인한 어려움과 multi-agent domain에서 agent 수에 비례하는 variance 증가로 인한 어려움을 겪는다. 이를 해결하기 위해, 다른 agent의 action policy를 고려하고 multi-agent coordination이 필요한 policy를 학습할 수 있는 actor-critic method를 제시한다. 또한 보다 각 agent에 대한 policy ensemble을 활용하는 method 또한 도입한다. Introduction : Q-learning에서의 non-stationary env는 학습 안정성 문제와 replay buffer 사용을 불가능하게 만든다. 반면에 policy gradient에서의 m.. 2022. 8. 6. [DRON] Opponent Modeling in Deep Reinforcement Learning International Conference on Machine Learning, New York, NY, USA, 2016. JMLR Abstract : multi-agent setting에서 policy와 opponent action을 공동으로 학습하는 model을 제시한다.해당 논문에서는 opponent action을 DQN encoding을 통해 예측하고, 원하는 경우 multi-tasking을 사용하여 emplict modeling을 유지한다. Mixture-of-Experts architecture을 사용하여 추가 supervision 없이 opponent strategy pattern을 자동으로 발견한다. Introduction : colaborative or competitive task에.. 2022. 7. 29. [CommNet] Learning Multi-agent Communication with Backpropagation 29th Conference on Neural Information Processing Systems (NIPS 2016), Barcelona, Spain Abstract : env에 영향을 주는 action과 agent간의 action을 고려한 두개의 network를 각각 최대화하는 RIAL & DIAL의 communication method와 다르게, CommNet에서는 communication은 policy와 동시에 학습된다. 해당 논문에서는 fully cooperative tasks에 대해서 continuous communication을 사용하는 simple neural model를 탐구한다. 방법의 적용으로, non-communicative agents & baseline보다 agent가 서로 .. 2022. 7. 29. [RIAL & DIAL] Learning to Communicate with Deep Multi-Agent Reinforcement Learning University of Oxford, United Kingdom Canadian Institute, Google DeepMind, May 2016 Abstract : MDRL에서는 효용을 극대화하기 위해, env를 감지하고 행동하는 multiple agents의 문제를 고려해야만 하므로 정보 공유를 위한 communication protocol이 필요하다. 복잡한 multi-agent env에서의 patial observability를 DNN을 수용하여 end-to-end agent 간의 학습을 해결한다. 해당 논문에서는 DQN 학습을 사용하는 RIAL(Reinforced Inter-Agent Learning)과 학습 도중 별도의 communication channel을 통해 backpropagatio.. 2022. 7. 26. 이전 1 2 3 4 5 6 7 ··· 13 다음 반응형