Bellman Optimality Equation

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2024 Apr 27 14:24
Editor
Edited
Edited
2024 Apr 27 15:13
Refs
Refs
목표는 value func의 참 값을 찾는 것이 아닌 최대의 reward를 얻는 policy를 찾는 것으로 상태가 많아질수록 비효율적인 방법
notion image
 
 
 

Bellman Update

 
 
 
 
 
 

Recommendations