ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 1. 데이터 시각화
    AI/2주차 2021. 8. 9. 11:45

    데이터 시각화는 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것이다. 

     

    시각화를 위해서는 데이터가 필요하다. 데이터는 다음과 같은 종류로 분류 할 수 있다.

    • 정형 데이터: 테이블 형태로 제공되는 데이터. Row가 데이터 1개 item, Column은 attribute. 주로 통계적 특성을 많이 시각화 하고, 피쳐간의 관계를 비교한다. 
    • 시계열 데이터: 시간 흐름에 따른 데이터. 기온, 주가 등 정형데이터와 음성 비디오와 같은 비정형 데이터가 존재. 시간 흐름에 따른 추세(Trend) , 계절성(Seasonality), 주기성(Cycle) 등을 살핌
    • 지리 데이터: 지도 정보와 보고자 하는 정보 간의 조화가 중요하며, 지도 정보를 단순화 시키는 경우도 있다. 
    • 관계형 데이터: 객체와 객체 간의 관계를 시각화(Graph Visualization / Network Visualization). 객체는 Node로 관계는 Link로. 크기, 색, 수 등으로 객체와 관계의 가중치를 표현. 
    • 계층적 데이터: 포함관계가 분명한 데이터. Tree, Treemap, Sunburst 등이 대표적
    • 다양한 비정형 데이터

    데이터를 세부적으로는 4가지로 분류할 수 있다. 

    • 수치형
      • 연속형: 길이, 무게, 온도
      • 이산형: 주사위 눈금, 사람 수
    • 범주형
      • 명목형(순서가 중요하지 않은 범주형): 혈액형, 종교
      • 순서형: 학년, 별점, 등급

    전주의적 특성: 주의를 주지 않아도 인지하게 되는 요소

    전주의적 속성


    Matplotlib

    matplotlib에서는 Figure라는 큰 틀에 Ax라는 subplot을 추가해서 만든다. 

    fig = plt.figure(figsize=(12, 7)) 
    # figsize로 가로 세율 비율을 지정
    ax = fig.add_subplot()
    # subplot 추가
    plt.show()

    plt.plot을 이용하여 선 그래프를 그릴 수 있다. plot의 인자로 color를 주면 색을 지정할 수 있고, label을 주면 범례를 지정할 수 있다. 범례를 표시하기 위해서는 ax.legend()를 하면 된다. 

     

    • set_title: ax의 title 지정
    • suptitle: figure의 큰 title 지정
    • xticks: x축을 나타내는 숫자 지정
    • xticklabels: x축을 나타내는 숫자를 label로 나타냄
    • text: ax에 글자 표시
    • annotate: ax의 원하는 좌표에 글자 표시

     

    'AI > 2주차' 카테고리의 다른 글

    6. Generative Models  (2) 2021.08.13
    5. RNN  (0) 2021.08.12
    4. Convolution  (0) 2021.08.11
    3. Optimization  (0) 2021.08.10
    2. 딥러닝 Basic & MLP  (0) 2021.08.09

    댓글

Designed by Tistory.