반응형 논문 리뷰/개인 정리2 Markov Models & Hidden Markov Models Speech and Language Processing. Daniel Jurafsky & James H. Martin. Copyright © 2021. All rights reserved. Draft of December 29, 2021. Markov Chains : Markov chain이란 sequences of random variables, states, values에 대한 probabilities를 말해주는 model이다. 이러한 set은 words, tages, symbols 등의 표현이 될 수 있다. 이는 current state에서 야기된 우리가 sequence에서 예측을 원하는 미래에 대한 강한 가정을 제공한다. → 과거 states(current state 이전)는 current sta.. 2022. 9. 20. DQN, DDQN, D3QN 비교 Abstract. 대표적 DRL algorithm인 DQN, DDQN(Double DQN), D3QN(Dueling DQN)을 등장 배경, 특징, 성능의 관점에서 비교해본다. DQN DQN background 1. Past RL challenges to high-dimensional input : hand-crafted feature representation에 의존하던 이전 RL은 high-dimensional input로부터 agent를 control하는 것에 취약했다. 2. DL advances & challenges to apply DL methods to RL : DL의 발전으로 raw sensory data에서 high-level feature를 추출 가능하게 되었지만 다음의 이유로 RL에 적.. 2022. 7. 4. 이전 1 다음 반응형