728x90
728x90
정형데이터: 통계적 분석을 수행할 수 있는 테이블 형태로 정리된 데이터
비정형데이터: 특별한 형식을 가지지 않는 텍스트, 이미지, 오디오와 같은 원시 데이터
- 형태와 구조가 복잡하여 기존의 DB에 저장될 수 없다. 정형 데이터로 변환되어 분석해야 한다.
반정형 데이터: 규격화된 형식을 가지지 않는 웹 문서, 신문과 같은 데이터. 주로 XML, JSON 포맷
- 데이터 속성을 표기하는 메타데이터를 가지며 데이터 구조는 일관성이 없으므로 테이블의 형식을 하고 있어도 샘플들의 속성 순서가 모두 다를 수 있다.
728x90
728x90
'데이터베이스 DB' 카테고리의 다른 글
분석용 데이터 101: 홀드아웃 교차 방법, 다중 교차 방법 (0) | 2020.08.16 |
---|---|
데이터 품질 요소, 데이터 무결성 (0) | 2020.08.16 |
데이터 오류 종류 (0) | 2020.08.16 |
데이터 분석 모형 검증: 탐색적 분석 (0) | 2020.08.16 |
분석용 데이터 탐색 101 : 기초 통계기법 용어, 데이터 분석 기법 종류 (0) | 2020.08.16 |
댓글