5V = 3V(Volume, Variety, Velocity) + Value + Veracity
1) Volume (규모의 증가)
-기술적 발전과 IT 서비스의 일상화로 디지털 정보량의 증가
2) Variety (다양성)
-데이터 종류의 증가
-비정형화된 데이터의 유형 증가
-고정 필드에 저장되는 정형 데이터(주소, 이름, 나이 등) 포함
3) Velocity (처리속도)
-데이터의 양과 내용이 끊임없이 변화
-실시간성 정보 증가 e.g. 사물, 스트리밍 정보
-데이터 생성, 이동(유통) 속도의 증가
-대규모 데이터의 빠른 처리 및 분석 속도 요구
4) Value (가치)
-대용량 데이터 내부에 함축된 가치를 찾는 것이 중요
-기존 DBMS 또는 데이터 분석 시스템으로는 작업이 어려움
5) Veracity (정확성)
-데이터의 정확성, 타당성, 신뢰성(데이터 신뢰 수준)
-어떤 결정을 내리는 데 타당한 데이터인지 판단하는 속성
6) Validty (유효성)
7) Volatility (휘발성)
8) Complexity (복잡성)
-데이터 종류의 확대(구조화되지 않은 데이터 등)와 외부데이터 활용으로 데이터 처리·관리 복잡
-데이터 저장방식의 차이로 데이터 중복성 문제 대두
9) Visulization (시각화)
-정보 사용 대상자의 이해 정도를 극대화하기 위해 필요
'Artificial Intelligence' 카테고리의 다른 글
히스토그램의 정의, 장단점 (0) | 2021.08.09 |
---|---|
빅데이터 시스템 조직 및 운영 체계 (1) | 2021.04.14 |
빅데이터 분석 기사 (0) | 2021.04.14 |
[AI] epoch, batch size, iteration, step (0) | 2021.02.21 |
ML 관련 Top-tier 학회 명단 (0) | 2021.02.11 |