Recursive equation that relates the value of a state to the values of its neighboring states현재 상태의 가치함수와 다음 상태의 가치함수 사이의 관계로 State-value function 표현 (3) 가치함수와 벨만방정식앞 장에서 문제를 MDP로 정의하는 방식에 대해 살펴보았다. 이제 본격적으로 가치함수와 큐함수, 벨만 기대 방정식과 벨만 최적 방정식에 대해 톺아보자.https://jang-inspiration.com/bellman-equationsumniya.tistory.comhttps://sumniya.tistory.com/5