반응형

안녕하세요, 왕초보 코린이를 위한 코딩유치원에 오신 것을 환영합니다.

 

 

오늘은 데이터 분석의 꽃이라 불리우는 데이터 시각화를 도와주는 라이브러리에 대해 배워보겠습니다.

 

matplotlib

: 파이썬 기반 시각화 라이브러리

 

1) 파이썬 표준 시각화 도구라고 불릴만큼 다양한 기능 지원

2) 세부 옵션을 통하여 아름다운 스타일링 가능

3) 다양한 그래프를 그릴 수 있음 

4) pandas와 연동이 용이함

 

 

다양한 그래프의 예시는 아래의 공식문서를 참고해주세요.

 

https://matplotlib.org/stable/gallery/index.html

 

Gallery — Matplotlib 3.4.2 documentation

Gallery This gallery contains examples of the many things you can do with Matplotlib. Click on any image to see the full image and source code. For longer tutorials, see our tutorials page. You can also find external resources and a FAQ in our user guide.

matplotlib.org

 

 

matplotlib 불러오기

 

matplotlib 라이브러리에는 다양한 패키지가 있지만 저희는 거의 pyplot만 사용할 예정입니다. pyplot은 numpy를 np, pandas를 pd로 사용하 듯이 plt로 줄여서 사용합니다.

 

# matplotlib.pyplot만 import 함

import matplotlib.pyplot as plt

 

matplotlib 기초

 

우선 정말 기본적인 그래프를 하나 그려보겠습니다.

 

plt.plot([1,2,3,4])
plt.ylabel('y-label')
plt.show()

 

 

그래프가 출력이 되었습니다. 오늘은 코드가 무엇을 의미하는지는 생각하지 말고 넘어가도록 하겠습니다.

 

 

 

<참고. 구 버전의 주피터 노트북의 경우, 아래의 설정을 해주어야 그래프가 표시됨>

 

저의 경우엔 정상적으로 그래프가 출력되었으나, 구 버전의 주피터 노트북을 사용하시는 분은 아래의 코드를 입력해주셔야 그래프가 정상적으로 출력된다고 합니다.

%matplotlib inline

 

 

한글 폰트 설정

 

별도로 한글 폰트 설정을 해주지 않으면 아래와 같이 그래프에 한글이 들어갔을 때 깨져서 나오게 됩니다.

 

참고로 데이터 분석은 Jupyter notebook과 Colab(구글에서 만듦)을 주로 이용하며, 두 가지 웹 기반 IDE에서 한글 폰트 설정하는 방법을 모두 알려드리도록 하겠습니다.

 

plt.plot([1,2,3,4])
plt.ylabel('한글 깨짐 확인')
plt.show()

 

문제 현상

 

 

주피터 노트북 한글폰트 설정

 

코딩유치원에서 주로 사용하는 주피터 노트북의 matplotlib 한글 폰트 설정법은 아래와 같습니다. 아주 간단하죠?

 

import os


# Mac OS의 경우와 그 외 OS의 경우로 나누어 설정

if os.name == 'posix':

    plt.rc("font, family="AppleGothic")

else

    plt.rc("font", family="Malgun Gothic")

 

한글과 영어 모두 잘 나오는 것을 확인 할 수 있습니다.

 

Colab 한글폰트 설정

 

주피터 노트북이 아닌 Colab을 사용하시는 분은 아래의 코드를 실행시켜 주세요.

 

# 네이버 나눔 폰트 설치
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

 

실행이 완료된 후에는 상단의 런타임 메뉴에서 런타임 다시 시작을 클릭해주신 후, 그 전에 실행했던  라이브러리 import와 데이터 셋 불러오기를 다시 해주셔야 합니다.

 

 

그 다음엔 아래의 코드로 font를 'NanumBarunGothic'으로 설정해 주세요. 폰트는 Nanum 폰트 중 아무거나 해주셔도 됩니다.

결과는 주피터 노트북과 같으니 생략하도록 하겠습니다.

plt.rc('font', family='NanumBarunGothic') 

 

 

기타 설정

 

그래프의 글씨가 흐릿하게 보이는 문제 해결

 

%config InlineBackend.figure_format = 'retina'

 

문제 현상

 

 

문제 해결 후 그래프 이미지

: 그래프가 크고 뚜렷하게 출력됨

 

 

그래프 크기 설정

 

데이터가 얼마나 많은가에 따라서 데이터들이 너무 가까이 붙어있거나 너무 큰 경우도 있습니다. 이럴 땐 아래의 코드를 이용해 적절한 크기로 조절해서 출력해보세요.

 

plt.rcParams["figure.figsize"] = (4, 3)  # (x, y) 그래프 크기 설정

 

 

오늘 준비한 내용은 여기까지입니다.

 

다음 시간부터는 pyplot 패키지에 대해서 하나씩 공부해보겠습니다.


<참고 자료>

 

1. 파이썬으로 시작하는 데이터 사이언스_네이버 부스트코스 무료강의

https://www.boostcourse.org/opencourse

 

2. 직장인을 위한 파이썬 데이터분석 올인원 패키지 Online_패스트 캠퍼스 유료강의

 

반응형

+ Recent posts