edwith_python_(10)boxplot, violinplot, swarmplot으로 데이터 시각화하기
Updated:
edwith 부스트코스 파이썬으로 시작하는 데이터 사이언스 를 공부하는 과정입니다.
지난 포스트 edwith_python_(9)barplot, lineplot, pointplot으로 데이터 시각화하기
11.5 boxplot
“신장(5Cm단위)”에 따른 “체중(5Kg단위)”를 “성별코드”로 구분하여 boxplot으로 나타내기
plt.figure(figsize = (10,4))
sns.boxplot(data=df, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="성별코드")
*결과*
박스 내 가로선: median 값(중앙값)
박스 위 변: 제 3사분위 수(75% 값)
박스 아래 변: 제 1사분위 수(25% 값)
위 수염 끝 가로선: 최대값
아래 수염 끝 가로선: 최솟값
수염 밖 점: 이상치
11.6 violinplot
“신장(5Cm단위)”에 따른 “체중(5Kg단위)”를 “음주여부”로 구분하여 violinplot으로 나타내기
plt.figure(figsize = (10,4))
sns.violinplot(data=df_sample, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="성별코드")
*결과*
violinplot은 boxplot내용을 더 자세하게 표현해줌 (데이터의 분포도 파악할 수 있음.)
가운데 흰색 점: median(중앙값)
가운데 두꺼운 선 길이: 사분위 범위
가운데 얇은 선 길이: 신뢰 구간(95% default)
위 내용을 violin의 split 기능을 사용하여 나타내기
plt.figure(figsize = (10,4))
sns.violinplot(data=df_sample, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="성별코드", split=True)
*결과*
11.7 swarm plot
- 범주형 데이터를 산점도로 시각화
“신장(5Cm단위)”에 따른 “체중(5Kg단위)”를 “음주여부”로 구분하여 swarmplot으로 나타내기
plt.figure(figsize = (10,4))
sns.swarmplot(data=df_sample, x="신장(5Cm단위)", y="체중(5Kg단위)", hue="음주여부")
*결과*
violinplot 내용을 점으로 나타냄
.
.
다음 포스트 edwith_python_(11)scatterplot, lmplot, distplot으로 데이터 시각화하기
Leave a comment