Chapter 2 : Markov Decision Process


문제를 잘 정의하면 문제의 절반은 풀었다고도 할 수 있습니다. 그만큼 문제를 정의하는 것이 중요한데 강화학습은 MDP로 표현되는 문제를 푸는 알고리즘의 집합입니다. MDP는 무엇이고 그 MDP와 강화학습이 어떻게 연결되어지는 것일까요?

1. MDP

2. Value Function

results matching ""

    No results matching ""