본문 바로가기
반응형

전체 글75

Prioritized Experience Replay Prioritized Experience Relpay 0. Abstract ▶ experience replay를 통해 online RL는 과거의 experiences를 기억하고 재사용 가능했으며, 이전 작업에서 replay transition은 replay memory에서 uniformly sampling → 그러나 이런 접근 방식은 중요성에 관계없이 원래 경험했던 것과 동일한 빈도로 transition을 단순히 replay ▶ 해당 논문에서는 중요한 transition을 더 자주 replay하여 더 효과적으로 학습할 수 있도록 prioritizing experience framework를 개발 → prioritized experience replay DQN은 Atari game에서 uniform rep.. 2021. 12. 29.
Dueling DQN Dueling Network Architectures for Deep Reinforcement Learning 0. Abstract ▶ 최근 몇년 동안 RL에서 deep representation를 사용하는데 많은 성공을 거두었으나 이러한 application 중 상당수는 CNN, LSTM, auto-encoders와 같은 기존 architecture 사용 ▶ 해당 논문에서는 Dueling network라는 두개의 개별 estimators인 RL을 위한 새로운 neural network architecture를 제시 → 하나는 state-value function, 또 다른 하나는 state-dependent action-advantage function으로 사용 → 이러한 factoring은 기본 RL.. 2021. 12. 14.
DDQN(Double DQN) Deep Reinforcement Learning with Double Q-learning 0. Abstract ▶ Q-learning algorithm(ex. DQN)은 특정 조건에서 action-value를 overestimate하는 것으로 알려짐 → 그러나 실제로 그러한 overestimate가 일반적인지, performance에 해를 끼치지는 않는지, 예방은 가능한지는 이전에 알려지지 않은 상태 ▶ DQN algorithm이 일부 game에서 상당한 overestimate를 겪고 있음 ▶ 해당 논문은 tabular setting으로 도입된 Double Q-learning에 대한 아이디어가 large-scale fucntion approximation과 함께 작동하도록 일반화될 수 있음을 보여줌 →.. 2021. 12. 12.
DQN(Deep Q-learning) Playing Atari with Deep Reinforcement Learning 0. Abstract ▶ 강화학습(Reinforcement Learning)을 사용하는 high-dimensinosal sensory input(ex. vision, speech)에서 policy control를 직접 학습하는 DL(Deep Learning) model ▶ Q-learning의 일종으로 훈련된 CNN(Convolutional Neural Network) - model input: raw pixel - model output: value function(future reward를 estimate하는 함수) 1. Introduction (1) Past RL challenges ▶ vision, speech와 .. 2021. 12. 11.
DRL for MultiagentSystems: A Review of Challenges,Solutions, and Applications Main Paper https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9043893 Deep Reinforcement Learning for MultiagentSystems: A Review of Challenges,Solutions, and Applications Abstract RL algorithm은 sequential decision-making problem을 해결하는데 사용되어 왔지만, high-dimensional env를 다룰 때 어려움에 직면했다. 최근 deep-learning의 발전으로 RL은 challenging env에서 효과적으로 수행가능한 정교하고 유능한 agent의 optimal policy를 제공하게 해준다. 이 논문은 co.. 2021. 8. 18.
A survey on MADRL: from the perspective of challenges and applications Main Paper https://ieeexplore.ieee.org/abstract/document/9164559 A survey on multi‐agent deep reinforcement learning: from the perspective of challenges and applications abstract 세상에는 다양한 multi-agent system이 존재하고, 이러한 system은 task를 수행하기 위해 cooperate or competitive하다. single RL과 비교하여, multi-agent RL은 larger search space, perception of other agents, system robustness를 지닌다. 이 논문은 current multi-agen.. 2021. 8. 17.
반응형