Bellman Expectation Equation

Creator
Creator
Seonglae Cho
Created
Created
2023 Jul 18 8:58
Editor
Edited
Edited
2024 Apr 27 14:30
Refs

Recursive equation that relates the value of a state to the values of its neighboring states

Vπ(s)=aπ(as)s,rp(s,rs,a)[r+γVπ(s)]V^π(s)=∑_aπ(a∣s)∑_{s',r}p(s',r∣s,a)[r+γV^π(s')]
현재 상태의 가치함수와 다음 상태의 가치함수 사이의 관계로
State-value function
표현
notion image
 
 
 
 
 
 

Recommendations