Overfitting removal
Data shuffling and Cross Validation is possible basically we do iid assumption
train set을 다시 train set + validation set으로 분리하지 않는다라고 가정하면, 우리는 모델 검증을 위해서 test set을 사용하여야 할 것이다
test set에 과적합 되는 문제'는 test set이 데이터 중 일부분으로 고정되어 있기 때문에 발생
먼저 전체 데이터 셋을 k개의 subset으로 나누고 k번의 평가를 실행하는데, 이 때 test set을 중복 없이 바꾸어가면서 평가를 진행한다. 이게 fold를 두번에 걸쳐 나눠서 전체를 validation으로 사용하는 이유
Cross Validation Methods