- 전체
- Sample DB
- database modeling
- [표준 SQL] Standard SQL
- G-SQL
- 10-Min
- ORACLE
- MS SQLserver
- MySQL
- SQLite
- postgreSQL
- 데이터아키텍처전문가 - 국가공인자격
- 데이터 분석 전문가 [ADP]
- [국가공인] SQL 개발자/전문가
- NoSQL
- hadoop
- hadoop eco system
- big data (빅데이터)
- stat(통계) R 언어
- XML DB & XQuery
- spark
- DataBase Tool
- 데이터분석 & 데이터사이언스
- Engineer Quality Management
- [기계학습] machine learning
- 데이터 수집 및 전처리
- 국가기술자격 빅데이터분석기사
- 암호화폐 (비트코인, cryptocurrency, bitcoin)
[국가기술자격 빅데이터분석기사][빅데이터분석기사 필기 요약] I.빅데이터 분석 기획 - 01. 빅데이터의 이해 (3)
빅데이터분석기사 필기 요약
???? 인공지능/ 빅데이터/ 개인정보보호/ 개인정보 비식별화
I. 빅데이터 분석 기획
01. 빅데이터의 이해
1. 빅데이터 개요 및 활용
2. 빅데이터 기술 및 제도
2. 빅데이터 기술 및 제도
[2] 인공지능의 개념
(1) 인공지능의 개념
- 인공지능
- 인간의 지적능력을 인공적으로 구현하여
- 컴퓨터가 인간의 지능적인 행동, 사고를
- 모방할 수 있도록 하는 소프트웨어 - 인공지능 ⊃ 머신러닝 ⊃ 딥러닝
(2) 빅데이터와 인공지능의 관계 ⇒ 상호보완 관계!
- (인공지능의 분석력, 예측력) + (빅데이터의 신뢰성, 현실성) ⇒ 의미있는 결과 도출
- 빅데이터로 말미암아 비정형 데이터 고속 분석이 가능해짐
→ 1950년대에 등장한 인공지능을 최신트렌드로 끌고 올 수 있게 됨
→ 자체 알고리즘으로 스스로 학습하는 딥러닝 기술
→ 특정 분야에서 인간의 지능을 뛰어넘는 능력!
- 상호보완 관계
- 빅데이터는 인공지능의 구현완성도 높여줌
- 인공지능은 빅데이터의 문제해결 완성도를 높여줌
- 빅데이터 기술이 주목받는 이유: 우수한 정보처리를 바탕으로 의미있는 결과를 도출!
- 빅데이터와 인공지능의 목표가 부합 → 빅데이터는 인공지능을 위한 기술이 될 가능성이 크다!
[3] 개인정보보호법·제도
(1) 개인정보보호: 정보 주체(개인)의 개인정보 자기 결정권을 철저히 보장하는 활동
- 개인정보 자기 결정권:
자신에 관한 정보가 언제, 어떻게, 어느 범위까지 타인에게 전달 및 이용될 수 있는지를
그 정보 주체가 스스로 결정할 수 있는 권리 - 개인정보: 살아있는 개인에 관한 정보/ 개인을 알아볼 수 있는 정보
(2) 개인정보보호의 필요성: 개인정보는 정보사회의 핵심 인프라
- 유출 시 피해 심각함/ 정보사회 핵심 인프라/ 개인정보 자기 통제권
(3) 빅데이터 개인정보보호 가이드라인
- 개인정보 비식별화/ 재식별 시 즉시 조치/ 민감정보 처리 금지
- 처리 사실, 목적 등을 공개해 투명성 확보/ 수집정보의 보호조치
(4) 개인정보보호 관련 법령 (개망신법이 유명하다고 함..)
- 개인정보 보호법/ 정보통신망법/ 신용정보법
- 위치정보법/ 개인정보의 안전성 확보조치 기준
(5) 개인정보보호 내규 | 데이터 수집 시 개인정보보호를 위한 가이드라인
- 정보보호 업무처리 지침/ 개발 보안 가이드/ 개인정보 암호화 매뉴얼
- 소프트웨어 개발 보안 구조/ 기술적, 관리적 보호
[4] 개인정보 활용
(1) 개인정보 비식별화
- 개인정보 일부/전부를 삭제/대체 → 다른 정보와 쉽게 결합해도 특정 개인을 식별할 수 없도록 하는 조치
- 데이터값 삭제/ 가명처리/ 총계처리/ 범주화/ 데이터 마스킹 등
(2) 개인정보 비식별화 절차 | 사전검토 → 비식별 조치 → 적정성 평가 → 사후관리
(3) 개인정보 비식별 조치 방법 | 가명처리/ 총계처리/ 데이터삭제/ 범주화/ 마스킹
- 가명처리: 식별할 수 없는 다른 값으로 대체
- 휴리스틱 익명화/ 암호화/ 교환방법
- (ex) 홍길동, 20대
- 총계처리: 통곗값 적용
- 총계처리 기본방식/ 부분집계/ 라운딩/ 데이터 재배열
- (ex) 연구실 학생들 키 합: 650cm
- 데이터 삭제: 특정 데이터값 삭제
- 속성값 삭제/ 부분 삭제/ 준 식별자 제거를 통한 단순 익명화
- (ex) 주민등록번호 → 90년대, 여성
- 데이터 범주화: 범주화(해당 그룹의 대푯값으로 변환), 범위화(구간 값으로 변환)
- 범주화 기본방식/ 랜덤 올림/ 범위 방법/ 세분 정보 제한 방법/ 제어 올림
- (ex) 박씨, 20~30세
- 데이터 마스킹: 전체 또는 부분적으로 대체값(공백, *, 노이즈)으로 변환
- 임의 잡음 추가/ 공백과 대체 방법
- (ex) 이OO, OO대학 재학
(4) 재식별 가능성 모니터링
- 정기적으로 모니터링 → 점검 항목 중 어느 하나에 해당하면 추가적인 비식별 조치 강구!
- 내부 요인의 변화: 추가적인 정보 수집/ 이용과정에서 생긴 새로운 정보/ 신규 or 추가 구축되는 시스템 등
- 외부 환경의 변화: 새로운 재식별 사례, 기술, 연계가능한 정보가 출현하거나 공개된 것으로 알려진 경우
참고 도서: 빅데이터분석기사 필기_수제비 2021
출처: https://sy-log.tistory.com/5?category=992358 [서윤로그:티스토리]
본 웹사이트는 광고를 포함하고 있습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.