회귀분석 기본

변수사이의 관계

  • 함수적 관계functional relation: $y=f(x)$
    • x, y간 완벽한 관계
  • 통계적 관계statistical relation: 보통의 상황

회귀모형

  • 통계적 관계의 두 변수를 설명하는 형식수단
    • 반응변수 Y가 예측변수 X에 의해 체계적으로 변하는 경향
    • 통계적 관계의 선 근방에 흩어진 점
  • 이것을 회귀모형으로 구현하기 위한 가정 두 가지(매우 중요)
    • X의 각 수준에 따라 Y의 확률분포가 존재(단순 값이 아니라 분포)
    • 확률분포의 평균은 X에 의해 체계적으로 변함(단순 값이 아니라 평균)
  • 상기 가정을 통해 X에 대한 Y의 회귀식(regression fucntion of Y on X)을 구함

회귀모형의 정형

  • $y_i = \beta_0 + \beta_1 x_i + \epsilon_i$
    • $y_i$는 관측값; 관측값이므로 오차항 $\epsilon_i$ 존재;
    • 오차항 분포는 (평균 0, $\sigma^2$)
      • 참고: 오차항이 N(0, $\sigma^2$) 따르는 정규오차회귀모형은 구간추정과 검정을 수행하기 위해 $\epsilon$의 분포를 가정한 것.
    • 따라서 $E\{y_i\} = E\{\beta_0 + \beta_1 x_i + \epsilon_i\} = \beta_0 + \beta_1 x_i$ -> $E[Y] = \beta_0 + \beta_1 X$
    • 즉, 확률변수Y의 평균이 X에 의해 체계적으로 변함
< !-- add by yurixu 替换Google的jquery并且添加判断逻辑 -->