본문 바로가기
반응형

프로그래밍/머신 러닝2

강화학습과 능동진동제어의 결합 강화학습은 최적제어 (optimal control)와 동일한 목표를 갖고 있다. 둘의 목표는 "주어진 문제에서 최적의 답을 찾는 것"이다. 그럼에도 이 둘을 구분짓는 것은 "제어하려는 대상의 모델을 모르고도 제어가 가능하냐"인 것 같다. 물론 최적제어 내에서도 적응제어 (adaptive control)의 개념이 있지만, 강화학습만큼 유연하지는 않다. 강화학습과 심층신경망 (deep neural network)를 결합할 시 아주 복잡한 대상의 액션도 묘사할 수 있으므로, 최적제어보다 더 복잡하고 다양한 대상체에 대해 유연한 제어가 가능하다. 능동진동제어에서 최적제어가 주로 사용되어왔고 관련된 연구는 매우 많다. 능동진동제어에 강화학습을 결합한 연구는 최근에 들어서야 이뤄지고 있는 걸로 보이며, 주로 랜덤한.. 2020. 12. 22.
강화학습이란 지도 학습 (supervised learning) vs 강화 학습 (reinforcement learning)기계 학습에서 가장 널리 알려진 학습 형태는 "지도 학습"입니다 . 지도 학습을 간단히 설명하면 "지도자 (supervisor)"의 도움을 받아 학습하는 것입니다. 아버지의 도움으로 자전거타는 법을 학습하는 어린아이의 모습을 생각하면 됩니다. 이 때, 지도자인 아버지는 본인이 생각하는 "자전거타는 방법에 대한 정답"을 아이에게 가르칩니다. 반면, 강화 학습은 지도자없이 혼자 시행착오를 거치며 자전거타는 방법을 배우는 것입니다. 하지만, 가르쳐주는 사람이 없는데 어떻게 자전거타는 방법을 깨우칠 수 있을까요? 결국 순차적 의사결정 문제!강화 학습이 결국 풀고자하는 문제는 순차적 의사결정 (sequen.. 2020. 12. 2.
반응형