본문 바로가기
데이터베이스 DB/서버 디비

데이터 비식별화

by tovantablack 2020. 8. 16.
728x90
728x90

데이터 비식별화: 데이터에 포함된 개인정보를 삭제하거나 다른 정보로 대체하여 데이터 내에서 특정 개인을 식별하지 못하게 하기 위해 개인정보를 어려운 데이터로 가공하는 과정.

개인정보: 이름, 주민, DNA처럼 특정 개인을 식별할 가능성을 내포한 데이터.

< 미연방거래위원회가 명시한 세 가지 비식별화 조치사항 >

1. 소비자, 컴퓨터 또는 다른 장치와 결합할 수 있는 개인정보는 반드시 비식별화

2. 공개된 정보에 대해서는 재식별화 시도 금지

3. 타 기업 등에 비식별화된 데이터 제공 시 데이터를 재식별화하지 않도록 계약상 명시

 

<데이터 비식별화 기법>

가명처리: 식별 가능한 변수값을 다른 값으로 대체.   e. 조이름 -> 김별명

총계처리: 데이터를 총합하거나 평균을 사용.   e. A연봉:5천만, B:8천만 -> 평균 연봉6500

데이터 값 제거: 개인 식별에 유의한 변수값 제거.   e. 조이름, 20, 서울시민 -> 20세 여, 서울

범주화: 데이터값을 범주화하여 명확한 값을 대체.   e. 조이름, 20, 서울 -> 조이름, 20, 한국

데이터 마스킹: 개인 식별에 유의한 변수값을 보이지 않도록 처리.  e. 조이름 -> **

728x90
728x90

'데이터베이스 DB > 서버 디비' 카테고리의 다른 글

XML, HTML, JSON 차이  (0) 2021.05.24
정규화 디테일  (0) 2020.08.17
ORM, JPA  (0) 2020.06.04
H2 connection  (0) 2020.06.04
application.properties  (0) 2020.06.04

댓글