12장: 데이터 시각화

데이터 시각화는 데이터를 그래프나 차트로 표현하여 쉽게 이해할 수 있도록 하는 기술입니다. 파이썬에서는 다양한 라이브러리를 사용하여 데이터를 시각화할 수 있습니다. 이 장에서는 `matplotlib`와 `seaborn` 라이브러리를 사용하여 데이터를 시각화하는 방법에 대해 알아보겠습니다.


#### 12.1 `matplotlib` 라이브러리


`matplotlib`는 파이썬에서 가장 많이 사용되는 데이터 시각화 라이브러리 중 하나입니다. 먼저, `matplotlib` 라이브러리를 설치해야 합니다.


```sh

pip install matplotlib

```


기본적인 선 그래프를 그리는 예제입니다.


```python

import matplotlib.pyplot as plt


# 데이터

x = [1, 2, 3, 4, 5]

y = [2, 3, 5, 7, 11]


# 선 그래프 그리기

plt.plot(x, y)

plt.xlabel('X축 라벨')

plt.ylabel('Y축 라벨')

plt.title('기본 선 그래프')

plt.show()

```


#### 12.2 막대 그래프


막대 그래프는 범주형 데이터를 비교하는 데 유용합니다. `bar` 함수를 사용하여 막대 그래프를 그릴 수 있습니다.


```python

# 막대 그래프 그리기

categories = ['A', 'B', 'C', 'D']

values = [5, 7, 3, 8]


plt.bar(categories, values)

plt.xlabel('카테고리')

plt.ylabel('값')

plt.title('기본 막대 그래프')

plt.show()

```


#### 12.3 히스토그램


히스토그램은 데이터의 분포를 나타내는 데 사용됩니다. `hist` 함수를 사용하여 히스토그램을 그릴 수 있습니다.


```python

import numpy as np


# 데이터 생성

data = np.random.randn(1000)


# 히스토그램 그리기

plt.hist(data, bins=30, alpha=0.7)

plt.xlabel('값')

plt.ylabel('빈도수')

plt.title('기본 히스토그램')

plt.show()

```


#### 12.4 산점도


산점도는 두 변수 간의 관계를 시각화하는 데 사용됩니다. `scatter` 함수를 사용하여 산점도를 그릴 수 있습니다.


```python

# 데이터 생성

x = np.random.rand(100)

y = np.random.rand(100)


# 산점도 그리기

plt.scatter(x, y)

plt.xlabel('X축')

plt.ylabel('Y축')

plt.title('기본 산점도')

plt.show()

```


#### 12.5 `seaborn` 라이브러리


`seaborn`은 `matplotlib`를 기반으로 한 고수준 데이터 시각화 라이브러리입니다. `seaborn`은 더 복잡한 시각화와 통계 그래프를 쉽게 그릴 수 있도록 도와줍니다. 먼저, `seaborn` 라이브러리를 설치해야 합니다.


```sh

pip install seaborn

```


`seaborn`을 사용한 기본적인 히스토그램 예제입니다.


```python

import seaborn as sns


# 데이터 생성

data = np.random.randn(1000)


# 히스토그램 그리기

sns.histplot(data, bins=30, kde=True)

plt.xlabel('값')

plt.ylabel('빈도수')

plt.title('Seaborn 히스토그램')

plt.show()

```


#### 12.6 `seaborn`을 사용한 막대 그래프


`seaborn`을 사용하여 막대 그래프를 그리는 예제입니다.


```python

# 데이터 생성

categories = ['A', 'B', 'C', 'D']

values = [5, 7, 3, 8]


# 막대 그래프 그리기

sns.barplot(x=categories, y=values)

plt.xlabel('카테고리')

plt.ylabel('값')

plt.title('Seaborn 막대 그래프')

plt.show()

```


#### 12.7 `seaborn`을 사용한 산점도


`seaborn`을 사용하여 산점도를 그리는 예제입니다.


```python

# 데이터 생성

x = np.random.rand(100)

y = np.random.rand(100)


# 산점도 그리기

sns.scatterplot(x=x, y=y)

plt.xlabel('X축')

plt.ylabel('Y축')

plt.title('Seaborn 산점도')

plt.show()

```


#### 12.8 페어플롯


페어플롯(pairplot)은 여러 변수 간의 관계를 시각화하는 데 사용됩니다. `seaborn`의 `pairplot` 함수를 사용하여 페어플롯을 그릴 수 있습니다.


```python

# 데이터셋 로드

iris = sns.load_dataset('iris')


# 페어플롯 그리기

sns.pairplot(iris, hue='species')

plt.title('Iris 데이터셋 페어플롯')

plt.show()

```


이상으로, 파이썬에서 데이터를 시각화하는 방법에 대해 알아보았습니다. 다음 장에서는 데이터 분석과 관련된 내용을 더 자세히 알아보겠습니다. 질문이나 요청사항이 있으시면 댓글로 남겨주세요!


---


이 글의 내용은 GoalKicker.com의 Python Notes for Professionals 책을 참조하였습니다.

댓글