Behavior Cloning

Creator

Created

2024 Jan 8 9:19

Editor

Edited

2024 Apr 27 10:10

Refs

Train policy suing supervised learning using data (reward and next state is not used for training)

Can’t treat

DAgger(data aggregation) is efficient to learning but hard to get expert data in real time (

////////