반응형 Distributed W-learning1 [Distributed W-Learning] Multi-Policy Optimization in Self-Organizing Systems 2009 Third IEEE International Conference on Self-Adaptive and Self-Organizing Systems Abstract : 여러 policies의 최적화를 위해서는 large scale agent-based system에서의 multi-agent approach가 필요하다. agent가 operating env를 공유함에 따라, agent 간, policy 구현 간 상당한 종속성이 발생할 수 있다. 해당 논문에서는 agent heterogeneity, policy dependency, global 지식 부족이 발생하는 경우, 자체 최적화를 해결하기 위해 distributed W-learning(DWL)을 제안한다. DWL는 multiple policies.. 2022. 7. 20. 이전 1 다음 반응형