728x90
728x90
디플라이어 패키지는 데이터를 핸들링하고 싶을 때 사용한다.
1) 원하는 변수select() /
2) 행(개체)filter()만 추출하거나,
3) 특정 변수를 기준으로 재정렬하거나 arrange()
4) 새로운 변수를 추출하거나 mutate()
5) 그룹별 요약통계량을 추출하고 group_by()/summariase() 싶을 때!
1)
#지방이랑 관련된 변수만 추출
#select(drinks,Total.Fat, Trans.Fat, Saturated.Fat) 이렇게 써도 되는데 밑처럼 쓰면 간단하게 추출 가능
select(drinks, contains("Fat"))
변수명 모르면 colnames(파일) 쳐서 실행시키면 확인 가능
저 변수들보다 많이 쓰는 건 필요없는 변수 제거인데, 그냥 변수명/함수명 앞에 마이너스를 붙이면 된다.
2)
필터는
3)
정렬
그냥 대충 보고 싶으면 View에서 빼고 치면 된다. 기본이 오름차순이고 내림차순으로 하고 싶으면 desc(변수명)
4)
변수 새로 만들기
5)
ctrl+shift+M 단축키 쓰면 chain operator( %>% ) 쉽게 칠 수 있음
728x90
728x90
'데이터베이스 DB' 카테고리의 다른 글
분석용 데이터 탐색 101: 기본 용어, 표본 추출 기법, 척도 종류(질적/양적 속성) (0) | 2020.08.16 |
---|---|
tidyr 패키지가 하는 일, 함수들 (0) | 2020.03.20 |
R working directory가 중요한 이유: setwd() 함수 (0) | 2020.03.20 |
모델 평가 방법: K-fold Cross Validation (0) | 2020.03.19 |
모델링 최적화와 일반화의 차이 (0) | 2020.03.19 |
댓글