Policy Rollout

Creator

Creator

Seonglae Cho

Created

Created

2024 Mar 7 12:34

Editor

Editor

Seonglae Cho

Edited

Edited

2024 Oct 22 23:53

Refs

Refs

Importance sampling

Episode, Trajectory Rollout

Policy Rollout Techniques

Boltzmann exploration

RL Target Network

Maximum Entropy Objective

UCB exploration

Trajectory can end in two ways

catastrophic failure, like crashing

truncation like exceeding the maximum episode length

AI에 관련된 논문과 지식을 포스팅한 블로그입니다.

https://ai-information.blogspot.com/2019/03/rollout-policy.html

$Rollout policy$

Recommendations

///////