Dreamer

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2024 Mar 23 13:7
Editor
Edited
Edited
2024 Jun 5 1:36
Refs
Refs
Dyna

2020 Dreamer V1

The very first working Dyna-style model-based RL implementation on pixel with data augmentation using imaginary rollout.
They reconstruct original observation using a decoder to catch all details unlike
TD-MPC
so it is slower. Any on-policy algorithm can be used to train actor/critic.
notion image
First case that model-based RL could be successful.
notion image
 
 

Dreamer V2

notion image

DayDreamer

World Models for Physical Robot Learning

Dreamer V3
Pixel based RL

처음으로 인간 데이터 없이
Minecraft
다이아몬드 캠
학습하는 월드 모델의 구조와 목적 함수에 있습니다. DreamerV3는 변형된 목적 함수를 사용하여 효과적으로 동작할 수 있는 정책을 학습
월드 모델은 복잡한 환경에서 감각 입력의 압축 표현을 학습하고, 가능한 행동에 대한 미래의 표현과 보상을 예측
policy가 계획을 가능하게 한다
  • Symlog Function
    • reward 가 크기 다양할 수 있는 걸 효율적으로 변환 발산방지 안정적 학습
https://humanoid-bench.github.io/
 
 
 

This looks like a baby deer being born and learning to walk (DayDreamer)

 
 

Recommendations