본문 바로가기
데이터베이스 DB

사분위값은 어디에 쓰는가? : Outlier 이상치 탐지법

by tovantablack 2020. 3. 12.
728x90
728x90

1, 56, 57,59, 100 이렇게 수가 구성되어있으면 이상치를 찾기 쉽지만, 비슷한 숫자들로 구성되어있으면 찾기가 어렵다.

이때, 이상치에 반응이 강건(둔감)한 median이나 IQM을 사용한다. mean은 이상치에 영향을 많이 받지만, 중앙값과 사분위값은 순서를 기준으로 정해지기 때문에 이상치에 영향을 많이 받지 않기 때문이다.

IQM은 mean과 median의 특성을 모두 갖고 있다.

728x90
728x90

댓글