728x90
728x90
<홀드아웃 교차 방법>
데이터 집합을 서로 겹치지 않는 훈련 집합과 시험 집합으로 무작위로 구분한 후, 훈련 집합을 이용하여 분석 모형을 구축하고 시험 집합을 이용하여 분석 모형의 성능을 평가하는 기법
계산량이 많지 않아 모형을 쉽게 평가할 수 있지만 모형 평가 결과가 training set과 test set의 구성에 의존적이라는 단점을 갖는다.
<다중 교차 방법>
데이터 집합을 무작위로 동일 크기를 갖는 k개의 부분 집합으로 나누고, 그중 1개를 시험집합으로, 나머지 k-1개를 훈련 집합으로 선정하여 모든 부분 집합들을 시험 집합으로 1회씩 선정하여 총 k번 반복한다.
모든 데이터 집합을 훈련&시험 집합으로 사용하기 때문에 분석 모형의 평가 결과가 편향되지 않는다는 장점이 있다.
728x90
728x90
'데이터베이스 DB' 카테고리의 다른 글
SQL 정규표현식: REGEXP (0) | 2020.12.17 |
---|---|
통계 기반 데이터 분석: 가설, 가설 검정 방법 종류, 가설검증의 오류 (0) | 2020.08.16 |
데이터 품질 요소, 데이터 무결성 (0) | 2020.08.16 |
정형/비정형/반정형 데이터 차이 (0) | 2020.08.16 |
데이터 오류 종류 (0) | 2020.08.16 |
댓글