반응형 전체 글75 Deep RL Value-based Methods From RL to Deep RL DQN variants - DQN - DDQN - PER - D3QN - Rainbow From RL to Deep RL TRL에서 discrete space에서 목적하던 Q-table은 state, action space의 증가로 인한 computation 증가로 neural network를 사용하여 continuous space를 처리하는 방식이 등장한다. DQN variants DQN : 가장 중요한 value-based RL method이다. Experience Replay, Fixed Q-targets가 사용되었다. neural network에 state를 input으로 넣으면 max action-value function인 action을 output으로 출력한.. 2022. 3. 3. Traditional RL RL Framework - Problem & Solution Dynamic Programming - System of Euqation Method - Iterative Method - Policy Evaluation - Policy Improvement - Policy Iteration - Value Iteration Monte Carlo Methods Temporal Difference Methods RL in Continuous Space RL Framework - Problem Reinforcement Learning이란? : agent가 env와의 interaction을 통해서 학습하는 방식이다. initial state S_0에서 action A_0을 하면 env는 new state S_1, n.. 2022. 3. 2. Combinatorial Optimization by POMO Combinatorial Optimization RL method POMO(Policy Optimization with Multiple Optima) Optimization in the field Combinatorial Optimization Combonatorial Optimization(조합최적화)란? : 주어진 item들의 최적 순서 또는 매핑(Mapping)을 찾는 문제(ex. 생산 설비 운영 최적화, 자원 할당 최적화, 운송 경로 최적화, ...)이다. TSP(Traveling Salesman Problem) : 모든 도시들의 좌표가 주어졌을 때, 가장 최소의 경로로 모든 도시를 이동하는 경로를 찾는 대표적인 조합최적화 예시이다. 모든 경우의 수를 다 해보고 최소 경로를 찾는 것이 최고지만, .. 2022. 3. 1. Model-free RL, Model-based RL Model Model-free RL vs Model-based RL Model-based RL Q-Planning Model Model이란? : env의 next state와 reward가 어떨지에 대한 agent의 예상이다. 쉽게 말해, env의 행동을 흉내내는 것으로 env가 어떻게 행동할지에 대한 추론을 허용한다. 위 수식에서처럼 reward는 policy와 model에 의존한다. State model과 Reward model로 구분된다. State model Reward model Known models : GO와 같은 많은 게임에서 게임의 규칙은 model이라고 할 수 있다. 현실에서의 물리 법칙 또한 model이다. 우리는 이를 modeling하고 그에 해당하는 simulator를 만들 수 있.. 2022. 2. 7. GNN, GCN GNN(Graph Neural Network) Graph representation GCN(Graph Convolutional Network) GNN(Graph Neural Network) GNN이란? : 기존 neural network의 input으로 사용되던 data(ex. image, sequential vector, ...)와 다르게 input data의 구조가 graph(ex. social graph, analysis graph, 3D graph, ...)의 형태일 경우에 직접 사용되는 neural network를 의미한다. vertex, edge, graph level에서의 prediction에 사용 가능하다. 발표된 논문으로는 Recurrent GNN, Spatial Convolutional.. 2022. 1. 21. Semi-supervised classification with GCN Semi-Supervised Classification with Graph Convolutional Networks 0. Abstract ▶ graph에서 직접 작동하는 convolution neural network의 효율적인 변형을 기반으로한, graph-structed data에 대한 semi-supervised 학습을 위한 접근 방식 제시 ▶ spectal graph convolution의 localized first-order approximation를 통해 convolution architecture를 선택하도록 동기를 부여 ▶ 해당 model은 graph의 edge' number에서 linear하게 확장되고 local graph structure와 node' feature을 모두 encodi.. 2022. 1. 21. 이전 1 ··· 3 4 5 6 7 8 9 ··· 13 다음 반응형