본문 바로가기

728x90
반응형
분류 전체보기
728x90
반응형
228

RStudio 패키지 설치 방법1) 콘솔에서 코딩 >install.packages("패키지이름") 엔터치면 실행됨 방법2) 파일 안에서 코딩 install.packages("패키지이름")하고 ctrl+enter 하면 실행됨 방법3) Packages > Install 탭에서 찾기 근데 왜인지 모르겠지만, 실행하니까 에러가 났다. 여러 패키지를 설치하려면 무슨 prioty R을 설치하라고 해서 그냥 설치했는데 그래도 에러: 객체 '~'를 찾을 수 없습니다. 가 떠서 찾아보니까 패키지 위치가 잘못되면 그럴 수 있다고 한다. 그래서 그냥 한 방법으로 통일시켜서 실행하는 걸 추천한다. 나는 파일 안에서 하는 방법으로 통일해서 해결했다. 2020. 3. 13.
RStudio 실행창 의미, 새 폴더 만들기 console에는 수치적인 결과가, plot에는 시각적인 결과가 나온다. File > New Project > New Directory 해서 디렉토리 만들고 해당 폴더에 데이터 넣어주면 오르쪽 상단 바에서 자기가 만든 디렉토리 보인다. 해당 디렉토리 클릭하면 넣은 데이터 파일들이 Files 섹션에 뜬다. 2020. 3. 13.
EDA 프로세스 중 탐색에서 필수적인 것 데이터 수집 - 탐색&전처리 - 모델링 - 모델 테스트 및 평가 탐색을 할 때 해당 데이터를 사용할 비지니스 파트에(산업군) 대한 이해가 필수적이다. 그래야만 어떤 데이터가 유의미한지를 알 수 있기 때문이다. 2020. 3. 13.
CSS 클래스 스타일 일괄적용 안되는 이유 CSS 코딩을 하다가 상위 클래스에 display flex 설정해놨는데도 하위 클래스 element에 적용이 안되어있는 것을 발견했다. 코드가 충돌되어서 그런 건데, 우선관계에 따라서 적용이 안되기도 한다. 크롬에서 F12를 누르면 나오는 개발자 모드에서 ㅡ밑줄이 쳐져있는 부분이 무시된 부분이다. 위와 같은 방법으로 실제 적용된 부분을 확인할 수 있다. 코딩할 때 알 수 있는 방법은 없는지 궁금하다. 아시는 분 있으시면 댓글로 알려주시면 감사하겠습니다 :-) 2020. 3. 13.
EDA 방법론3: Feature Engineering Feature Engineering : 머신러닝 모델을 위한 데이터의 Feature를 생성하거나 선택하는 작업 Feature: 행과 열이 있는 데이터에 열을 일컫는 말 첫 행이 변수의 이름, 행이 관측치, 열이 특징 1) 결측치 대체 기존에 있던 값 중에 무작위로 넣거나, 중앙값을 넣거나, 최빈값을 넣거나 NA를 하나의 카테고리로 보고 그대로 살리는 등의 방법으로 대체한다. NA: 결측치(측정되지 않은 수치) 2) 변수 단위 조정 표준화, 최소-최대 정규화 공식을 사용해서 조정해준다. 3) 변수 변환 - 특히, 로그 변환 데이터의 분포가 극단으로 치우쳐져 있는 경우 고르게 해 주기 위해 사용. x’ = log(x-min(x)+1) =>좀 복잡하지만 데이터에 0이 들어가지 않도록 해주는 식이다. 일반 로그.. 2020. 3. 12.