본문 바로가기
데이터베이스 DB

정형/비정형/반정형 데이터 차이

by tovantablack 2020. 8. 16.
728x90
728x90

정형데이터: 통계적 분석을 수행할 수 있는 테이블 형태로 정리된 데이터

비정형데이터: 특별한 형식을 가지지 않는 텍스트, 이미지, 오디오와 같은 원시 데이터

- 형태와 구조가 복잡하여 기존의 DB에 저장될 수 없다. 정형 데이터로 변환되어 분석해야 한다.

반정형 데이터: 규격화된 형식을 가지지 않는 웹 문서, 신문과 같은 데이터. 주로 XML, JSON 포맷

- 데이터 속성을 표기하는 메타데이터를 가지며 데이터 구조는 일관성이 없으므로 테이블의 형식을 하고 있어도 샘플들의 속성 순서가 모두 다를 수 있다.

728x90
728x90

댓글