edwith_python_(9)barplot, lineplot, pointplot으로 데이터 시각화하기
Updated:
edwith 부스트코스 파이썬으로 시작하는 데이터 사이언스 를 공부하는 과정입니다.
지난 포스트 edwith_python_(8)histogram과 countplot으로 데이터 시각화하기
11.3 barplot - 수치형 vs 범주형 데이터 시각화
“연령대코드(5세단위)”와 “총콜레스테롤”을 “흡연상태”로 구분하여 barplot으로 나타내기
plt.figure(figsize=(8,4))
sns.barplot(data=df_sample, x="연령대코드(5세단위)", y="총콜레스테롤", hue="흡연상태")
*결과*
흡연 상태:
1 = 피우지 않는다
2 = 이전에 피웠으나 끊었다
3 = 현재도 피우고 있다
전체 데이터 df로 그래프를 그리면 시간이 오래걸리므로, df_sample을 통해 빠르게 알아볼 수 있음.
sample 데이터로 그린 그래프에 나타나는 검은 세로 막대는 ‘신뢰구간’을 나타냄.
“연령대코드(5세단위)”와 “총콜레스테롤”을 “음주여부”로 구분하여 barplot으로 나타내기
plt.figure(figsize=(8,4))
sns.barplot(data=df_sample, x="연령대코드(5세단위)", y="총콜레스테롤", hue="음주여부", ci=None)
*결과*
ci = None : 신뢰구간을 나타내지 않음
ci - “sd” : 표준편차를 나타냄
“연령대코드(5세단위)”에 따른 “트리글리세라이드”를 “음주여부”로 구분하여 barplot으로 나타내기
plt.figure(figsize=(8,4))
sns.barplot(data=df_sample, x="연령대코드(5세단위)", y="트리글리세라이드", hue="음주여부")
*결과*
음주를 하는 사람들의 트리글리세라이드 수치가 대체로 높게 나타남
트리글리세라이드: 중성지방을 의미
“연령대코드(5세단위)”에 따른 “체중(5kg단위)”를 “음주여부”로 구분하여 barplot으로 나타내기
plt.figure(figsize = (8,4))
sns.barplot(data=df, x="연령대코드(5세단위)", y="체중(5Kg단위)", hue="음주여부")
*결과*
전 연령대에서, 음주하는 사람들의 체중이 많이 나가는 것으로 나타남
11.4 lineplot 과 pointplot
“연령대코드(5세단위)”에 따른 “혈색소”를 “음주여부”로 구분하여 lineplot으로 나타내기
plt.figure(figsize = (10,4))
sns.lineplot(data=df_sample, x="연령대코드(5세단위)", y="혈색소", hue="음주여부")
*결과*
전 연령대에서, 음주를 하는 사람의 혈색소 수치가 높게 나타남
“연령대코드(5세단위)”에 따른 “체중(5Kg단위)”를 “음주여부”로 pointplot으로 나타내기
plt.figure(figsize = (10,4))
sns.pointplot(data=df_sample, x="연령대코드(5세단위)", y="체중(5Kg단위)", hue="음주여부")
*결과*
다음 포스트 edwith_python_(10)boxplot, violinplot, swarmplot으로 데이터 시각화하기
Leave a comment