Gradient Clipping

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2023 Jul 6 9:13
Editor
Edited
Edited
2024 Oct 21 11:39

Can be considered as an adaptive learning rate without smoothing

FP overflow시 없에준다.
기울기 폭주를 막기 위해 임계값을 넘지 않도록 값을 자릅
RNN
에서 유용하다
보통 norm에 따라 값을 정해서 clip한다
 
 
 
 
 

Recommendations