회귀분석 복습
Updated:
어떤 독립변수와 종속변수 사이에 인과관계가 있을 때, 그 관계의 통계적 유의미성을 검증하고, 그 관계 정도를 분석하는 것.
- Durbin-Watson: 0~4 범위의 값을 가지며, 2에 가까워야 함. 2에 가까울수록 다중회귀분석에 사용된 변수들이 회귀모형에 적합하다고 해석.
- 유의확률(p-value): 0.05 미만인 것이 회귀분석에서 통계적인 의미가 있다고 해석.
- R(상관관계): -1~1 범위의 값을 가지며, 절대값이 1에 가까울수록 서로간 관계가 높다고 해석.
- 공차는 0.1 이상, VIF는 10 미만이면 다중공선성에 문제가 없다고 해석. (다중공선성이란 연구모형에 사용된 변수가 어떤 것인지 헷갈릴 때, 다중공선성이 있다라고 표현함. (?이해 잘 못함. 많이 쓰는 개념은 아닌 듯)
- *(별표): *가 있으면 유의미=가설이 채택되었다는 의미
*가 1개이면, 유의수준 95%에서 채택되었음을 의미
*가 2개이면, 유의수준 99%에서 채택되었음을 의미
*가 3개 이면, 유의수준 99.9%에서 채택되었음을 의미 - 만약 기호가 (+)이고 **이면 ‘(독립변수)가 높아질수록 (종속변수)가 향상된다는 것이 유의하다’라고 해석
- 비표준화 계수끼리는 단위가 다르면 비교하기 어려우므로, 비표준화 계수를 표준화한 것
- R2(결정계수): 독립변수에 의해 종속변수가 설명되는 설명력.
참고 블로그 링크
- 상관분석이란?
A와 B가 서로 상관이 있는 지 알아보는 것. 인과관계는 알 수 없음.
상관계수는 보통 피어슨 상관계수를 줄여서 말하며, 기호는 r로 나타냄. -1~1 범위의 값을 가지며, 절대값이 1에 가까울수록 강한 상관관계를 가진다고 해석.절대값 0.7 이상: 강한 상관관계
절대값 0.3 - 0.7: 보통 상관관계
절대값 0.1 - 0.3: 약한 상관관계
Leave a comment