Value Iteration

Creator
Creator
Seonglae Cho
Created
Created
2024 Apr 5 3:36
Editor
Edited
Edited
2025 Apr 6 17:47
Refs
Refs
notion image
각 반복에서 모든 상태에 대해 가능한 모든 행동을 고려하여 최대 기대값을 가진 행동을 선택하고, 이를 기반으로 가치 함수를 업데이트
 
 
 
 
 
 
 
 

Recommendations