12장: 데이터 시각화
데이터 시각화는 데이터를 그래프나 차트로 표현하여 쉽게 이해할 수 있도록 하는 기술입니다. 파이썬에서는 다양한 라이브러리를 사용하여 데이터를 시각화할 수 있습니다. 이 장에서는 `matplotlib`와 `seaborn` 라이브러리를 사용하여 데이터를 시각화하는 방법에 대해 알아보겠습니다.
#### 12.1 `matplotlib` 라이브러리
`matplotlib`는 파이썬에서 가장 많이 사용되는 데이터 시각화 라이브러리 중 하나입니다. 먼저, `matplotlib` 라이브러리를 설치해야 합니다.
```sh
pip install matplotlib
```
기본적인 선 그래프를 그리는 예제입니다.
```python
import matplotlib.pyplot as plt
# 데이터
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 선 그래프 그리기
plt.plot(x, y)
plt.xlabel('X축 라벨')
plt.ylabel('Y축 라벨')
plt.title('기본 선 그래프')
plt.show()
```
#### 12.2 막대 그래프
막대 그래프는 범주형 데이터를 비교하는 데 유용합니다. `bar` 함수를 사용하여 막대 그래프를 그릴 수 있습니다.
```python
# 막대 그래프 그리기
categories = ['A', 'B', 'C', 'D']
values = [5, 7, 3, 8]
plt.bar(categories, values)
plt.xlabel('카테고리')
plt.ylabel('값')
plt.title('기본 막대 그래프')
plt.show()
```
#### 12.3 히스토그램
히스토그램은 데이터의 분포를 나타내는 데 사용됩니다. `hist` 함수를 사용하여 히스토그램을 그릴 수 있습니다.
```python
import numpy as np
# 데이터 생성
data = np.random.randn(1000)
# 히스토그램 그리기
plt.hist(data, bins=30, alpha=0.7)
plt.xlabel('값')
plt.ylabel('빈도수')
plt.title('기본 히스토그램')
plt.show()
```
#### 12.4 산점도
산점도는 두 변수 간의 관계를 시각화하는 데 사용됩니다. `scatter` 함수를 사용하여 산점도를 그릴 수 있습니다.
```python
# 데이터 생성
x = np.random.rand(100)
y = np.random.rand(100)
# 산점도 그리기
plt.scatter(x, y)
plt.xlabel('X축')
plt.ylabel('Y축')
plt.title('기본 산점도')
plt.show()
```
#### 12.5 `seaborn` 라이브러리
`seaborn`은 `matplotlib`를 기반으로 한 고수준 데이터 시각화 라이브러리입니다. `seaborn`은 더 복잡한 시각화와 통계 그래프를 쉽게 그릴 수 있도록 도와줍니다. 먼저, `seaborn` 라이브러리를 설치해야 합니다.
```sh
pip install seaborn
```
`seaborn`을 사용한 기본적인 히스토그램 예제입니다.
```python
import seaborn as sns
# 데이터 생성
data = np.random.randn(1000)
# 히스토그램 그리기
sns.histplot(data, bins=30, kde=True)
plt.xlabel('값')
plt.ylabel('빈도수')
plt.title('Seaborn 히스토그램')
plt.show()
```
#### 12.6 `seaborn`을 사용한 막대 그래프
`seaborn`을 사용하여 막대 그래프를 그리는 예제입니다.
```python
# 데이터 생성
categories = ['A', 'B', 'C', 'D']
values = [5, 7, 3, 8]
# 막대 그래프 그리기
sns.barplot(x=categories, y=values)
plt.xlabel('카테고리')
plt.ylabel('값')
plt.title('Seaborn 막대 그래프')
plt.show()
```
#### 12.7 `seaborn`을 사용한 산점도
`seaborn`을 사용하여 산점도를 그리는 예제입니다.
```python
# 데이터 생성
x = np.random.rand(100)
y = np.random.rand(100)
# 산점도 그리기
sns.scatterplot(x=x, y=y)
plt.xlabel('X축')
plt.ylabel('Y축')
plt.title('Seaborn 산점도')
plt.show()
```
#### 12.8 페어플롯
페어플롯(pairplot)은 여러 변수 간의 관계를 시각화하는 데 사용됩니다. `seaborn`의 `pairplot` 함수를 사용하여 페어플롯을 그릴 수 있습니다.
```python
# 데이터셋 로드
iris = sns.load_dataset('iris')
# 페어플롯 그리기
sns.pairplot(iris, hue='species')
plt.title('Iris 데이터셋 페어플롯')
plt.show()
```
이상으로, 파이썬에서 데이터를 시각화하는 방법에 대해 알아보았습니다. 다음 장에서는 데이터 분석과 관련된 내용을 더 자세히 알아보겠습니다. 질문이나 요청사항이 있으시면 댓글로 남겨주세요!
---
이 글의 내용은 GoalKicker.com의 Python Notes for Professionals 책을 참조하였습니다.
댓글
댓글 쓰기