context 뭐할지
- 날짜별 split
- conversation에서 대상의 대화 횟수
- conversation에서 전체 발화중 대상의 발화 비율
- 대화 토큰 개수
해보니 길이 다른게 문제라서
- 100 발화씩 자르는게 좋을듯 너무 편차가 크다 혹은 토큰 1000개 찰때마다 해서 16개 보내기?
- 프롬프트는 e/i 이면 Introvert / Extrovert
- 가장 첫번째껄로 text classification 추출?
- 크리고 벡터 db에서
- 월요일까지 간단한 chat demo는 나와야한다
한번에 metric 보내면 llm 이 하나에 attention 해서 evidence를 4가지 모든 메트릭에 사용하고 이유도 잘 제공 못했고
토큰문제로 evidences도 안다양했다.
Seonglae Cho