해당 trajectory 발생 확률만큼만 Off-policy data 고려할 수 있도록 수학적으로 사용해서 데이터 더 많이 사용하고 importance만큼 고려 Annealed Importance Sampling (AIS)고정된 제안 분포를 사용하는 게 아니라 분포를 점진적으로 변화시키며, 중간 분포를 통해 목표 분포로 가는 과정을 통해 샘플을 추출 MCMC