빅데이터의 방법론 중 표현 단계에 속하는 데이터 시각화에 대해 알아보도록 하겠다. 시각화의 정의와 개념 그리고 시각화 기술에 대해 알아보자.
[11. 데이터 시각화]
1. 시각화의 정의
1) 시각화(Visualization)
: 분석한 데이터의 특징이나 분석의 결과를 분석가 및 사용자들이 쉽게 이해할 수 있도록 그림이나 그래프 등을 표현하여 주는 기술을 말한다. 같은 의미로 '표현(Representation)'으로 나타낼 수도 있다. 유의미한 정보가 파급효과를 일으킬 수 있도록 하는 빅데이터의 가장 중요한 마지막 단계라고 할 수 있다.
2) 시각화의 절차
- 정보 조직화 단계
: 사용자의 정보 인지에 관여하는 단계로
혼돈의 상태로 존재하고 있는 데이터를 분류, 배열, 조직화하여 질서를 부여해 사용자를 설득한다.
- 정보 시각화 단계
: 사용자의 정보 지각에 관여하는 단계로
보다 효율적으로 정보 전달을 하기 위하여 인간의 오감과 관련된 감각 기관에 최적의 자극을 부여하는 방법 제시한다.
- 상호작용 단계
: 정보와 사용자 간의 상호작용 측면으로서 사용자 경험(UX)을 디자인하는 단계로
정보의 인지적 요인 뿐만 아니라 지각적 요인을 함께 활용한다. 정보 시각화 단계와 밀접하게 연동되면서 동시에 입력 기술의 특성 또한 함께 고려
2. 시각화 기술
1) Tag Cloud
: 태그 연관성에 따른 빈발도 및 관계 분석하는 것으로 메타데이터에서 얻은 태그를 다양한 기준으로 분석하여 표현한다.
대부분 웹페이지 또는 이미지를 2차원 표형태로 배치하여 표현한다.
각 태그들의 인기도를 한 눈에 파악 가능해 트렌드 파악에 사용된다.
빈도수가 높을수록 중앙에 크게 출력되는 특징을 갖는다.
2) Gephi
: 데이터를 네트워크 형태로 생성 후 표현하는 도구이다. 가공되지 않은 그래프 데이터를 네트워크로 생성한다.
사용자가 데이터 및 노드의 위치를 자유롭게 수정 및 조절 가능하며 기본적인 노드 표현 예시를 제공한다.
3) GraphViz
: 흐름도나 트리 다이어그램 생성 표현 도구로 데이터를 기반으로 다이어그램을 그릴 수 있는 명령어 라인 네트워크 그래프 시각화 도구로, 흐름도와 트리표현에 활용 가능하다. 다양한 디자인 옵션을 제공하여 커스터마이즈 가능하다.
4) Processing
: 그래픽 디자인을 위한 프로그래밍 언어이다.(JAVA기반)
디자이너와 아티스트의 프로그래밍 접근도를 높여주는 IDE를 이용하여 손쉽게 그래픽 표현을 구현할 수 있는 프로그래밍 환경이다. 다양한 함수를 통하여 커스터마이즈 된 그래픽 표현 가능하다.
5) Tableau
: 데이터의 시각적 분석과 보고 도구를 제공한다. 그래프(노드사이의 연관성)를 시각화하는 데스크톱 응용 프로그램으로 전문적인 출판물(신문, 학술지 등)에 첨부할 다양한 형태의 그래프 생성에 용이하다.
이상으로 빅데이터의 방법론의 모든 과정에 대한 대략적인 이론적인 설명이 끝이 났다.
다음글에서는 빅데이터 프로젝트의 기획과 관리에 대해 알아보겠다.
'시간 관리 및 생산성 도구 > 빅데이터' 카테고리의 다른 글
[이론]12.빅데이터 프로젝트 기획과 관리 (0) | 2022.09.03 |
---|---|
[이론]8.데이터마이닝의 정의,적용분야,방법론,적용사례 (0) | 2022.08.26 |
[이론]6. 데이터 분석도구 R의 이해와 기본문법 (0) | 2022.08.24 |
데이터 분석도구 R, R Studio 설치하기 (0) | 2022.08.24 |
[이론]5. 빅데이터의 저장소 설계와 관리 (0) | 2022.08.23 |
댓글