Allocative SAE

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2024 Nov 18 20:20
Editor
Edited
Edited
2024 Nov 18 20:29
Refs
Refs
There are a total sparsity upper bound for token-feature matching as a resource allocation problem constraint.

TopK SAE

각 입력 토큰이 최대k 개의 feature activation만 갖도록 제한
문제: 일부 토큰은 쉽게 재구성 가능하지만, 일부는 더 많은 특징이 필요함

Feature Choice SAE

토큰당 feature 제한 뿐 아니라 feature당 token 제한도 둬서 특정 특징의 과도한 사용 방지하여 효율적 자본배분

Mutual Choice SAEs

재구성 어려운 토큰에 더 많은 자원을 배정해 성능 개선
 
 
OpenAI Top-k SAE
Feature Choice SAE, Mutual Choice SAEs
 
 

Recommendations