본문 바로가기
Python/Python개요

[Python Study] 1-4. Matplotlib 패키지 익히기

by Delants 2022. 7. 29.

1. 서론

오늘은 Matplotlib 패키지에 대해 알아보겠습니다.

Matplotlib패키지는 데이터를 시각화하는데 중점을 둔 패키지로, 막대그래프, 산점도와 같은 기본 차트 뿐만 아니라, 수평이산분포, 히트맵, 원형차트, 히스토그램 등 다양한 데이터를  시각화할 수 있습니다.

데이터를 시각화했을 경우 장점은 직관적으로 보기 쉽다는 것입니다. 즉, 어떤 데이터가 우수하고 열등한지, 많고 적은지 확인이 바로바로 가능하기 때문에  시간을 크게 단축시킬 수 있죠. 또한 분석 중, 분석 후 보고서를 만들거나 발표할 때 매우 용이하게 사용될 수 있습니다.

 

수평이산분포
히트맵
원형차트

 

2. Matplolib의 활용 - 막대그래프 그리기 

그러면 이러한 패키지는 어떻게 활용될 수 있는지 막대그래프를 그리는 과정을 담은 코드를 보면서 직접 확인해 보겠습니다.

 

STEP1. (데이터 프레임 만들기)

Pandas(목차로 보면 1-2) 에서 설명했던 것처럼 임의의 데이터 프레임을 만들어 보도록 하겠습니다.

이번에는 광역시의 면적을 바탕으로 만들어 보겠습니다.

In [29]

1특별시와 6대광역시 이름 정보를 region변수로 선언하였고

1특별시와 6대광역시의 면적정보를 area변수로 선언하였습니다.

이 때, 각 도시 이름과 면적이 매칭될 수 있게 하였습니다.

 

In [30]

In29에서 만든 해당 리스트를 하나의 데이터셋으로 사용하기 위해 list(zip())함수를 사용했으며, 그 묶은 데이터셋의 이름은 area데이터가 되게 하였습니다. 

 

In [35]

데이터프레임으로 변환하는 작업을 진행하였고, 데이터프레임이 생성되었습니다.

 

 

 

STEP2. (차트그리기 준비)

주피터 노트북에서 그래프를 출력할 수 있게 %matplotlib inline을 입력합니다.

이후에는 matplotlib를 사용하기 위해 import시켜줍니다.

matplotlib.pyplot을 다 쓰기는 시간이 많이 걸리므로 as를 사용하여 이를 plt라는 별칭으로 부르기로 지정합니다.

 

 

 

STEP3. (막대그래프 그리기)

 

 

STEP4. (막대그래프 출력)

해당 그래프를 보고,

 

1. 인천과 울산의 면적이 비슷하고, 제일 넓습니다.

2. 광주의 면적이 제일 작다는 것을 확인할 수 있습니다.

3. 또한 서울은 3번째로 작은 면적임을 볼 수 있습니다.

 

 

 

 

 

 

이렇게 matplotlib를 사용하면 직관적이면서도, 해당 데이터셋에 대한 인사이트를 얻을 수 있기 때문에 파이썬 데이터 분석에서 중요한 패키지 중 하나입니다.

 

다음시간에는 실제 데이터 분석을 하는 과정을 보여드리도록 하겠습니다.

 

 

사진 출처 및 참고사항: https://matplotlib.org/stable/gallery/index.html

 

 

 

 

 

댓글