markdown repo to dataset
dataset to huggingface chromadb
tei, chroma server 이용
생각보다 추천 자체는 잘 된다
thenlper/gte-small
이거 잘 되긴 하는데 multlingual 아니라서 한글에서 약함 (거의 안되는 수준)
Jina Embedding 같이 long context제공 확인해봐야
Vercel function이 문제
- sentence transformer로 title embedding 하는거랑 db size가 문제
Seonglae Cho