reader가 비슷한 단어들끼리는 헷갈려하거나 그냥 많이 나온걸로 답하는 경우가 많아서
답안을 반복해서 노출해라information density 혹은 answer를 위한 evidence density를 높여라 라는 게 prompt안에 명시적으로 들어가는게 나중에 글쓸때도 좋을 것 같습니다tag 지우기 p tag 제외
retriever augmented training 방향으로 가는게 나을수도
- rewrite
- summary에 substring없는 데이터는 그냥 버리는 걸로?
gpt summarizers - gpt-abstract, gpt-abstract-gold, gpt-extract, gpt-extract-gold
Seonglae Cho