제퍼넷 로고

Seaborn을 사용하여 Python에서 상자 그림을 생성하는 종합 가이드

시간

Seaborn을 사용하여 Python에서 상자 그림을 생성하는 종합 가이드

상자 그림은 데이터 세트의 분포를 이해할 수 있는 강력한 시각화 도구입니다. 이는 데이터 세트의 최소값, 1분위수, 중앙값, 3분위수, 최대값과 잠재적 이상값에 대한 요약을 제공합니다. 이 기사에서는 Seaborn 라이브러리를 사용하여 Python에서 상자 그림을 만드는 방법을 살펴보겠습니다.

Seaborn은 Matplotlib을 기반으로 구축된 인기 있는 데이터 시각화 라이브러리입니다. 아름답고 유익한 통계 그래픽을 생성하기 위한 고급 인터페이스를 제공합니다. 상자 도표는 Seaborn이 손쉽게 생성할 수 있는 다양한 유형의 도표 중 하나입니다.

시작하려면 Seaborn이 설치되어 있는지 확인하세요. pip를 사용하여 설치할 수 있습니다.

"
pip 설치 시본
"

Seaborn을 설치한 후에는 Python 스크립트 또는 Jupyter Notebook으로 가져올 수 있습니다.

"`파이썬
sns로 seaborn 가져 오기
"

이제 Seaborn을 사용하여 상자 그림을 만드는 방법을 살펴보겠습니다.

1단계: 데이터 로드
상자 그림을 만들기 전에 작업할 데이터가 필요합니다. Seaborn은 연습에 사용할 수 있는 내장 데이터 세트를 제공합니다. 이 가이드에서는 레스토랑에서 고객이 제공한 팁에 대한 정보가 포함된 "팁" 데이터세트를 사용합니다.

"`파이썬
sns로 seaborn 가져 오기

# "팁" 데이터세트를 로드합니다.
팁 = sns.load_dataset(“팁”)
"

2단계: 기본 상자 그림 만들기
Seaborn을 사용하여 기본 상자 그림을 만들려면 `boxplot()` 함수를 사용할 수 있습니다. 이 함수는 데이터와 선택적 매개변수를 사용하여 플롯의 모양을 사용자 정의합니다.

"`파이썬
sns로 seaborn 가져 오기

# 기본 상자 그림을 만듭니다.
sns.boxplot(x=tips[“total_bill”])
"

이 예에서는 "tips" 데이터 세트에서 "total_bill" 열의 상자 그림을 만듭니다. 'x' 매개변수는 x축에 표시할 데이터를 지정합니다.

3단계: 상자 그림 사용자 정의
Seaborn은 상자 그림을 더욱 유익하고 시각적으로 매력적으로 만들 수 있는 다양한 사용자 정의 옵션을 제공합니다. 다음은 몇 가지 예입니다.

– 축에 제목과 레이블 추가:

"`파이썬
sns로 seaborn 가져 오기
matplotlib.pyplot을 plt로 가져 오기

# 기본 상자 그림을 만듭니다.
sns.boxplot(x=tips[“total_bill”])

# 제목과 라벨 추가
plt.title("총 청구서의 상자 그림")
plt.xlabel(“총 청구서”)
plt.ylabel("빈도")
"

– 색상 팔레트 변경:

"`파이썬
sns로 seaborn 가져 오기

# 다른 색상 팔레트를 사용하여 기본 상자 그림을 만듭니다.
sns.boxplot(x=tips[“total_bill”], 팔레트=”블루스”)
"

– 다른 변수를 기준으로 데이터 그룹화:

"`파이썬
sns로 seaborn 가져 오기

# 요일별로 그룹화된 상자 그림을 만듭니다.
sns.boxplot(x=”일”, y=”total_bill”, 데이터=팁)
"

이 예에서는 "day" 열을 기준으로 데이터를 그룹화하고 y축에 "total_bill" 열을 표시합니다.

4단계: 이상값 처리
상자 그림은 데이터 세트의 이상값을 식별하는 데 특히 유용합니다. Seaborn은 다양한 방식으로 이상값을 처리할 수 있는 옵션을 제공합니다. 기본적으로 Seaborn은 이상값으로 간주되는 개별 데이터 포인트를 표시합니다. 그러나 `showfliers` 매개변수를 사용하여 이상값의 모양을 제거하거나 변경할 수 있습니다.

이상값을 제거하려면 다음을 수행하십시오.

"`파이썬
sns로 seaborn 가져 오기

# 이상값을 표시하지 않고 상자 그림을 만듭니다.
sns.boxplot(x=tips[“total_bill”], showfliers=False)
"

이상값의 모양을 변경하려면 다음을 수행하십시오.

"`파이썬
sns로 seaborn 가져 오기

# 이상값에 대해 다른 마커 스타일을 사용하여 상자 그림을 만듭니다.
sns.boxplot(x=tips[“total_bill”], flierprops={“marker”: “o”, “markerfacecolor”: “red”, “markersize”: 8})
"

5단계: 상자 그림 저장
상자 그림을 만든 후에는 나중에 사용하거나 공유하기 위해 이미지 파일로 저장할 수 있습니다. Seaborn은 Matplotlib의 `savefig()` 함수를 사용하여 플롯을 저장하는 간단한 방법을 제공합니다.

"`파이썬
sns로 seaborn 가져 오기
matplotlib.pyplot을 plt로 가져 오기

# 기본 상자 그림을 만듭니다.
sns.boxplot(x=tips[“total_bill”])

# 플롯을 이미지 파일로 저장
plt.savefig("box_plot.png")
"

이 예에서는 상자 그림이 현재 디렉터리에 "box_plot.png"로 저장됩니다.

결론
상자 그림은 데이터 세트의 분포를 시각화하는 데 유용한 도구입니다. Seaborn을 사용하면 Python에서 유익하고 시각적으로 매력적인 상자 그림을 쉽게 만들 수 있습니다. 이 포괄적인 가이드를 따르면 이제 Seaborn을 사용하여 상자 그림을 생성하고 필요에 맞게 사용자 정의하는 방법을 잘 이해하게 될 것입니다. 즐거운 음모를 꾸미세요!

spot_img

최신 인텔리전스

spot_img