edwith_python_(10)boxplot, violinplot, swarmplot으로 데이터 시각화하기

Updated:

edwith 부스트코스 파이썬으로 시작하는 데이터 사이언스 를 공부하는 과정입니다.

지난 포스트 :point_right: edwith_python_(9)barplot, lineplot, pointplot으로 데이터 시각화하기


11.5 boxplot

“신장(5Cm단위)”에 따른 “체중(5Kg단위)”를 “성별코드”로 구분하여 boxplot으로 나타내기
plt.figure(figsize = (10,4))
sns.boxplot(data=df, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="성별코드")

*결과*

박스 내 가로선: median 값(중앙값)
박스 위 변: 제 3사분위 수(75% 값)
박스 아래 변: 제 1사분위 수(25% 값)
위 수염 끝 가로선: 최대값
아래 수염 끝 가로선: 최솟값
수염 밖 점: 이상치

11.6 violinplot

“신장(5Cm단위)”에 따른 “체중(5Kg단위)”를 “음주여부”로 구분하여 violinplot으로 나타내기
plt.figure(figsize = (10,4))
sns.violinplot(data=df_sample, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="성별코드")

*결과*

violinplot은 boxplot내용을 더 자세하게 표현해줌 (데이터의 분포도 파악할 수 있음.)
가운데 흰색 점: median(중앙값)
가운데 두꺼운 선 길이: 사분위 범위
가운데 얇은 선 길이: 신뢰 구간(95% default)

위 내용을 violin의 split 기능을 사용하여 나타내기
plt.figure(figsize = (10,4))
sns.violinplot(data=df_sample, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="성별코드", split=True)

*결과*

11.7 swarm plot

  • 범주형 데이터를 산점도로 시각화
“신장(5Cm단위)”에 따른 “체중(5Kg단위)”를 “음주여부”로 구분하여 swarmplot으로 나타내기
plt.figure(figsize = (10,4))
sns.swarmplot(data=df_sample, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="음주여부")

*결과*

violinplot 내용을 점으로 나타냄

.
.
다음 포스트 :point_right: edwith_python_(11)scatterplot, lmplot, distplot으로 데이터 시각화하기

Categories:

Updated:

Leave a comment