본문 바로가기
데이터베이스 DB

ggplot boxplot

by tovantablack 2020. 3. 13.
728x90
728x90

코드
실행화면 중 일부

무엇을 먼저 쓰느냐에 따라 결과가 달라진다.

앞처럼 쓰면 박스가 포인트에 가려지기 때문에 중요한 데이터를 가리게 된다.

순서를 바꾼 코드
바뀐 실행화면

이렇게 해야 유의미한 데이터 분석 결과를 놓치지 않고 확인할 수 있다.

 

박스플롯을 쓰면서 점을 찍는 이유는 데이터의 개수와 outlier를 확인하여 데이터의 신뢰도를 쉽게 파악할 수 있기 때문이다.

728x90
728x90

댓글