edwith_python_(9)barplot, lineplot, pointplot으로 데이터 시각화하기

Updated:

edwith 부스트코스 파이썬으로 시작하는 데이터 사이언스 를 공부하는 과정입니다.

지난 포스트 :point_right: edwith_python_(8)histogram과 countplot으로 데이터 시각화하기


11.3 barplot - 수치형 vs 범주형 데이터 시각화

“연령대코드(5세단위)”와 “총콜레스테롤”을 “흡연상태”로 구분하여 barplot으로 나타내기
plt.figure(figsize=(8,4))
sns.barplot(data=df_sample, x="연령대코드(5세단위)", y="총콜레스테롤", hue="흡연상태")

*결과*

흡연 상태:
1 = 피우지 않는다
2 = 이전에 피웠으나 끊었다
3 = 현재도 피우고 있다

전체 데이터 df로 그래프를 그리면 시간이 오래걸리므로, df_sample을 통해 빠르게 알아볼 수 있음.
sample 데이터로 그린 그래프에 나타나는 검은 세로 막대는 ‘신뢰구간’을 나타냄.

“연령대코드(5세단위)”와 “총콜레스테롤”을 “음주여부”로 구분하여 barplot으로 나타내기
plt.figure(figsize=(8,4))
sns.barplot(data=df_sample, x="연령대코드(5세단위)", y="총콜레스테롤", hue="음주여부", ci=None)

*결과*

ci = None : 신뢰구간을 나타내지 않음
ci - “sd” : 표준편차를 나타냄

“연령대코드(5세단위)”에 따른 “트리글리세라이드”를 “음주여부”로 구분하여 barplot으로 나타내기
plt.figure(figsize=(8,4))
sns.barplot(data=df_sample, x="연령대코드(5세단위)", y="트리글리세라이드", hue="음주여부")

*결과*

음주를 하는 사람들의 트리글리세라이드 수치가 대체로 높게 나타남
트리글리세라이드: 중성지방을 의미

“연령대코드(5세단위)”에 따른 “체중(5kg단위)”를 “음주여부”로 구분하여 barplot으로 나타내기
plt.figure(figsize = (8,4))
sns.barplot(data=df, x="연령대코드(5세단위)", y="체중(5Kg단위)", hue="음주여부")

*결과*

전 연령대에서, 음주하는 사람들의 체중이 많이 나가는 것으로 나타남

11.4 lineplot 과 pointplot

“연령대코드(5세단위)”에 따른 “혈색소”를 “음주여부”로 구분하여 lineplot으로 나타내기
plt.figure(figsize = (10,4))
sns.lineplot(data=df_sample, x="연령대코드(5세단위)", y="혈색소", hue="음주여부")

*결과*

전 연령대에서, 음주를 하는 사람의 혈색소 수치가 높게 나타남

“연령대코드(5세단위)”에 따른 “체중(5Kg단위)”를 “음주여부”로 pointplot으로 나타내기
plt.figure(figsize = (10,4))
sns.pointplot(data=df_sample, x="연령대코드(5세단위)", y="체중(5Kg단위)", hue="음주여부")

*결과*

다음 포스트 :point_right: edwith_python_(10)boxplot, violinplot, swarmplot으로 데이터 시각화하기

Categories:

Updated:

Leave a comment