BoW
Assumption: words are independent, order doesn’t matter (Unigram Language model)
Data representation method which do not considering order, only focus on frequency
Originated from Texture Recognition
생성하거나 예측하는 것의 학습에는 유효하지 않다
- represent word as one-hot vector word마다 id부여 index
→ all is orthogonal → similarity 0 → cannot contain semantic
데이터의 분포를 보고 이 데이터 corpus가 어떤 종류의 corpus인지 판단
04-02 Bag of Words(BoW)
단어의 등장 순서를 고려하지 않는 빈도수 기반의 단어 표현 방법인 Bag of Words에 대해서 학습합니다. ## 1. Bag of Words란? Bag of Words…
https://wikidocs.net/22650

Bag of Words 기법
최근 Bag of Words (BoW) 기법에 대해 정리를 해 보려고 자료를 봤는데 생각보다 시간이 많이 걸렸습니다. 개념과 주요 접근법에 대해서만 정리하려고 했는데 어느 논문 하나에서 막히는 바람에 몇 주가 흘러버렸네요... 먼저 참고한 자료는 다음과 같습니다.위키피디아: Bag of Words Model in Computer Vision (BoW에 대한 전반적인 내용)Li Fei-Fei, Rob Fergues, Antonio Torralba, "Recognizing and Learning Object Categories", ICCV 2005 short course (iccv 2005 best short course award)[Csurka04] G. Csurka, C. Dance, L.X. Fan, ..
https://darkpgmr.tistory.com/125

Seong-lae Cho