Bellman Optimality Equation

Creator

Creator

Seonglae Cho

Created

Created

2024 Apr 27 14:24

Editor

Editor

Seonglae Cho

Edited

Edited

2024 Apr 27 15:13

Refs

Refs

목표는 value func의 참 값을 찾는 것이 아닌 최대의 reward를 얻는 policy를 찾는 것으로 상태가 많아질수록 비효율적인 방법

notion image

Bellman Update

Recommendations

/////////