본문 바로가기
데이터베이스 DB

분석용 데이터 101: 홀드아웃 교차 방법, 다중 교차 방법

by tovantablack 2020. 8. 16.
728x90
728x90

<홀드아웃 교차 방법>

데이터 집합을 서로 겹치지 않는 훈련 집합과 시험 집합으로 무작위로 구분한 후, 훈련 집합을 이용하여 분석 모형을 구축하고 시험 집합을 이용하여 분석 모형의 성능을 평가하는 기법

계산량이 많지 않아 모형을 쉽게 평가할 수 있지만 모형 평가 결과가 training settest set의 구성에 의존적이라는 단점을 갖는다.

 

<다중 교차 방법>

데이터 집합을 무작위로 동일 크기를 갖는 k개의 부분 집합으로 나누고, 그중 1개를 시험집합으로, 나머지 k-1개를 훈련 집합으로 선정하여 모든 부분 집합들을 시험 집합으로 1회씩 선정하여 총 k번 반복한다.

모든 데이터 집합을 훈련&시험 집합으로 사용하기 때문에 분석 모형의 평가 결과가 편향되지 않는다는 장점이 있다.

728x90
728x90

댓글