본문 바로가기
데이터베이스 DB

dplyr 패키지 용도, 각 함수가 하는 일

by tovantablack 2020. 3. 20.
728x90
728x90

디플라이어 패키지는 데이터를 핸들링하고 싶을 때 사용한다.

 

1) 원하는 변수select() /

2) 행(개체)filter()만 추출하거나,

3) 특정 변수를 기준으로 재정렬하거나 arrange()

4) 새로운 변수를 추출하거나 mutate()

5) 그룹별 요약통계량을 추출하고 group_by()/summariase() 싶을 때!

 

 

1)

#지방이랑 관련된 변수만 추출
#select(drinks,Total.Fat, Trans.Fat, Saturated.Fat) 이렇게 써도 되는데 밑처럼 쓰면 간단하게 추출 가능
select(drinks, contains("Fat"))

 

변수명 모르면 colnames(파일) 쳐서 실행시키면 확인 가능

 

보통 많이 쓰는 함수들 

저 변수들보다 많이 쓰는 건 필요없는 변수 제거인데, 그냥 변수명/함수명 앞에 마이너스를 붙이면 된다.

이렇게

2)

필터는 

필터 조건 거는 방법

3)

정렬

arrange 함수 !이거 필터 아님!

그냥 대충 보고 싶으면 View에서 빼고 치면 된다. 기본이 오름차순이고 내림차순으로 하고 싶으면 desc(변수명)

 

4) 

변수 새로 만들기

mutate

5)

ctrl+shift+M 단축키 쓰면 chain operator( %>% ) 쉽게 칠 수 있음

summeraise

 

728x90
728x90

댓글