for numerical stability
- load is faster than
.pt
file because this library avoids unnecessary copies by mapping
- no arbitrary code can be put into it.
매우 긴 시퀀스는 수치안정성 문제 있는데 그래서 Sequential Data 처리 작업에서 유용
softmax 함수를 계산할 때 입력값의 최댓값을 빼고 지수 함수를 계산하여 정규화함
Pytorch, Numpy, Tensorflow, Flax 지원
From
Safetensor Usages