728x90
728x90
1, 56, 57,59, 100 이렇게 수가 구성되어있으면 이상치를 찾기 쉽지만, 비슷한 숫자들로 구성되어있으면 찾기가 어렵다.
이때, 이상치에 반응이 강건(둔감)한 median이나 IQM을 사용한다. mean은 이상치에 영향을 많이 받지만, 중앙값과 사분위값은 순서를 기준으로 정해지기 때문에 이상치에 영향을 많이 받지 않기 때문이다.
IQM은 mean과 median의 특성을 모두 갖고 있다.
728x90
728x90
'데이터베이스 DB' 카테고리의 다른 글
EDA 프로세스 중 탐색에서 필수적인 것 (0) | 2020.03.13 |
---|---|
EDA 방법론3: Feature Engineering (0) | 2020.03.12 |
EDA 방법론 2: 시각화 Visualization (0) | 2020.03.12 |
EDA 방법론1: 요약통계량 Summary Statistics (0) | 2020.03.12 |
EDA의 중요성 (0) | 2020.03.12 |
댓글