-
1. 데이터 시각화AI/2주차 2021. 8. 9. 11:45
데이터 시각화는 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것이다.
시각화를 위해서는 데이터가 필요하다. 데이터는 다음과 같은 종류로 분류 할 수 있다.
- 정형 데이터: 테이블 형태로 제공되는 데이터. Row가 데이터 1개 item, Column은 attribute. 주로 통계적 특성을 많이 시각화 하고, 피쳐간의 관계를 비교한다.
- 시계열 데이터: 시간 흐름에 따른 데이터. 기온, 주가 등 정형데이터와 음성 비디오와 같은 비정형 데이터가 존재. 시간 흐름에 따른 추세(Trend) , 계절성(Seasonality), 주기성(Cycle) 등을 살핌
- 지리 데이터: 지도 정보와 보고자 하는 정보 간의 조화가 중요하며, 지도 정보를 단순화 시키는 경우도 있다.
- 관계형 데이터: 객체와 객체 간의 관계를 시각화(Graph Visualization / Network Visualization). 객체는 Node로 관계는 Link로. 크기, 색, 수 등으로 객체와 관계의 가중치를 표현.
- 계층적 데이터: 포함관계가 분명한 데이터. Tree, Treemap, Sunburst 등이 대표적
- 다양한 비정형 데이터
데이터를 세부적으로는 4가지로 분류할 수 있다.
- 수치형
- 연속형: 길이, 무게, 온도
- 이산형: 주사위 눈금, 사람 수
- 범주형
- 명목형(순서가 중요하지 않은 범주형): 혈액형, 종교
- 순서형: 학년, 별점, 등급
전주의적 특성: 주의를 주지 않아도 인지하게 되는 요소
Matplotlib
matplotlib에서는 Figure라는 큰 틀에 Ax라는 subplot을 추가해서 만든다.
fig = plt.figure(figsize=(12, 7)) # figsize로 가로 세율 비율을 지정 ax = fig.add_subplot() # subplot 추가 plt.show()
plt.plot을 이용하여 선 그래프를 그릴 수 있다. plot의 인자로 color를 주면 색을 지정할 수 있고, label을 주면 범례를 지정할 수 있다. 범례를 표시하기 위해서는 ax.legend()를 하면 된다.
- set_title: ax의 title 지정
- suptitle: figure의 큰 title 지정
- xticks: x축을 나타내는 숫자 지정
- xticklabels: x축을 나타내는 숫자를 label로 나타냄
- text: ax에 글자 표시
- annotate: ax의 원하는 좌표에 글자 표시
'AI > 2주차' 카테고리의 다른 글
6. Generative Models (2) 2021.08.13 5. RNN (0) 2021.08.12 4. Convolution (0) 2021.08.11 3. Optimization (0) 2021.08.10 2. 딥러닝 Basic & MLP (0) 2021.08.09