Hierarchical Navigable Small words
hnsw structure does not require training
HNSW Algorithm Notion
HNSW Algorithm Tools
Implementing HNSW for Redis vector with a suspect of Hierarchical level
Scaling HNSWs - <antirez>
https://antirez.com/news/156
Efficient and robust approximate nearest neighbor search using...
We present a new approach for the approximate K-nearest neighbor search based on navigable small world graphs with controllable hierarchy (Hierarchical NSW, HNSW). The proposed solution is fully...
https://arxiv.org/abs/1603.09320

대충? 거의 정확하다! 벡터 검색 엔진에 ANN HNSW 알고리즘 도입기 (feat. SWIG Golang)
벡터 기반 유사도 검색 엔진에서 KNN 방식만 사용하면, 백만 단위로 문서 수가 늘어나는 경우 성능의 한계에 도달하고 맙니다. 이때, 필연적으로 ANN 알고리즘 도입에 대해서 고민하게 될 것입니다. 이 세션에서는 ANN 알고리즘 중의 하나인 HNSW 알고리즘을 도입하게 된 배경 및 알고리즘에 대해 알아보고, 어떻게 도입했는지에 대해 공유합니다. 추가로 C++ 기반인 HNSW를 Golang에서 사용하기 위해 SWIG를 사용한 경험도 공유합니다.
https://forward.nhn.com/2022/sessions/42
Lucene ANN 분석1 - HNSW algorithm
참고 Efficient and robust approximate nearest neighbor search using HNSW 논문 C++ HNSW implementation with python bindings Lucene95HnswVectorsFormat code 배경 ANN(Approximate Nearest Neighbor)이란 공간에서 query 벡터와 유사한 벡터(문서, 이미지 등이 학습된 데이터)들을 빠르게 검색하는 알고리즘 이다. Approximate라 표현하는 이유는 ANN이 반환한 벡터들이 실제 정답셋이 아니다. 벡터 크기가 보통 1000차원 이상 크고 학습하는 데이터도 규모있는 서비스 경우 수 억건이 넘어가기에 실제 정답을 구하는 비용이 크다. 효율적으로 계산하기 위해 recall(재..
https://chocolate-life.tistory.com/11

Seonglae Cho