- Intrinsic - 임베딩 자체의 품질을 직접적으로 평가하는 방법으로 보통 거리측정으로
- Extrinsic - Task에 적용하여 score 확인
Text embedding Evaluations
Leaderboard
OpenAI embedding, AWS or commercial embedding has much larger context window like 8192
Task 마다 성능 편차 아주 심하니 leaderboard 전체 성능만 보고 결정하면 안된다.