Action-value function

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2024 Mar 22 3:8
Editor
Edited
Edited
2024 Apr 30 8:3

Q function, value function, State-Action-Value function

In practice, Q value is harder to fit than value function.
  1. linear value function
    1. notion image
      notion image
      + least squares or regression then minimize error
 
notion image
We only need to fit V
어떤 상태에서 어떤 행동이 얼마나 좋은지 저장이 Q Table
상태들을 일반화하는 것은 Q table 만드는 것이 어렵습니다. 이는 상태가 너무 많기 때문입니다. 따라서 이를 해결하는 방법은 이전에 경험한 상황을 새로운, 비슷한 상황에 일반화하는 것입니다. 이는 특징 기반 표현(Feature-Based Representations)을 사용하여 이루어집니다. 이것은 기계 학습에서 근본적인 개념으로, 우리는 이를 자주 볼 수 있습니다
Action-value estimations
 
 
 
 
 
 

Recommendations