Recall-Oriented Understudy for Gisting Evaluation
n-gram Recall based
- machine translation
ROUGE score가 대체로 인간의 판단과 양의 상관관계를 보여서 summarization같은 high level 과제에서 좋은 성능ROUGE는 다양한 길이의 Sequence에서 stability and reliability
- ROUGE-N
- ROUGE-L
- ROUGE-W
- ROUGE-S
- ROUGE-SU
- ROUGE-N-precision