MBTI-GPT Retrieval

Creator

Creator

Seonglae Cho

Created

Created

2023 Nov 25 17:17

Editor

Editor

Seonglae Cho

Edited

Edited

2024 Aug 7 16:57

Refs

Refs

context 뭐할지

날짜별 split

conversation에서 대상의 대화 횟수

conversation에서 전체 발화중 대상의 발화 비율

대화 토큰 개수

해보니 길이 다른게 문제라서

100 발화씩 자르는게 좋을듯 너무 편차가 크다 혹은 토큰 1000개 찰때마다 해서 16개 보내기?

프롬프트는 e/i 이면 Introvert / Extrovert

가장 첫번째껄로 text classification 추출?

크리고 벡터 db에서

월요일까지 간단한 chat demo는 나와야한다

한번에 metric 보내면 llm 이 하나에 attention 해서 evidence를 4가지 모든 메트릭에 사용하고 이유도 잘 제공 못했고

토큰문제로 evidences도 안다양했다.

Metric 분리 → retrieval 별도가능 → 연관 데이터만 효율적 데이터 사용

Recommendations

////