회귀분석 복습

Updated:

어떤 독립변수와 종속변수 사이에 인과관계가 있을 때, 그 관계의 통계적 유의미성을 검증하고, 그 관계 정도를 분석하는 것.

회귀분석

  1. Durbin-Watson: 0~4 범위의 값을 가지며, 2에 가까워야 함. 2에 가까울수록 다중회귀분석에 사용된 변수들이 회귀모형에 적합하다고 해석.
  2. 유의확률(p-value): 0.05 미만인 것이 회귀분석에서 통계적인 의미가 있다고 해석.
  3. R(상관관계): -1~1 범위의 값을 가지며, 절대값이 1에 가까울수록 서로간 관계가 높다고 해석.
  4. 공차는 0.1 이상, VIF는 10 미만이면 다중공선성에 문제가 없다고 해석. (다중공선성이란 연구모형에 사용된 변수가 어떤 것인지 헷갈릴 때, 다중공선성이 있다라고 표현함. (?이해 잘 못함. 많이 쓰는 개념은 아닌 듯)
  5. *(별표): *가 있으면 유의미=가설이 채택되었다는 의미
    *가 1개이면, 유의수준 95%에서 채택되었음을 의미
    *가 2개이면, 유의수준 99%에서 채택되었음을 의미
    *가 3개 이면, 유의수준 99.9%에서 채택되었음을 의미
  6. 만약 기호가 (+)이고 **이면 ‘(독립변수)가 높아질수록 (종속변수)가 향상된다는 것이 유의하다’라고 해석
  7. 비표준화 계수끼리는 단위가 다르면 비교하기 어려우므로, 비표준화 계수를 표준화한 것
  8. R2(결정계수): 독립변수에 의해 종속변수가 설명되는 설명력.
    참고 블로그 링크
  • 상관분석이란?
    A와 B가 서로 상관이 있는 지 알아보는 것. 인과관계는 알 수 없음.
    상관계수는 보통 피어슨 상관계수를 줄여서 말하며, 기호는 r로 나타냄. -1~1 범위의 값을 가지며, 절대값이 1에 가까울수록 강한 상관관계를 가진다고 해석.

    절대값 0.7 이상: 강한 상관관계
    절대값 0.3 - 0.7: 보통 상관관계
    절대값 0.1 - 0.3: 약한 상관관계

Categories:

Updated:

Leave a comment