DoReMi

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2023 Jun 29 14:39
Editor
Edited
Edited
2023 Jun 29 14:40
Refs
Refs
먼저 작은 프록시 모델을 사용하여 Group DRO를 적용하여 도메인 가중치(혼합 비율)를 생성
도메인 가중치를 사용하여 데이터셋을 재샘플링하고 더 큰 전체 규모의 모델을 훈련
이를 통해 DoReMi는 사전 훈련 데이터 도메인의 혼합 비율을 조정하여 언어 모델의 성능을 최적화
 
 
 
 
 
 
 

Recommendations