본문 바로가기
연구방법론

추측통계학: t-검정(t-test)과 분산분석(ANOVA)

by Potatoing 2024. 6. 20.
728x90
반응형

모수통계(Parametric) 방법 

통계방법 목적 측정수준
독립변수 종속변수
Independent t-test 두 집단 간의 평균차이 검정 명목척도 등간/비척도
Paired t-test 두 개의 짝지워진 집단이나 한 집단에서 전후 측정된 값의 평균 차이 검정 명목척도 등간/비척도
ANOVA(분산분석) 두개 이상의 독립적인 집단끼리 평균 차이 검정 명목척도 등간/비척도
Pearson correlation 두 변수간의 상관성 검정 등간/비척도 등간/비척도
Multiple regression analysis 두 개 이상의 독립변수가 한 개의 종속변수를 예측 등간/비척도 등간/비척도

 
 

728x90

 

1. t-검정(t-test)

  1) 두 모집단 평균의 차이를 비교할 경우 이용된다.
  2) 독립적인 두 표본의경우 Independent t-test
  3) 쌍을 이룬 두 표본의 경우 Paired t-test
  4) Student t-test라고도 한다.
  5) 종속변수는 연속형 변수이고, 독립변수는 이분값으로 주어진 범주형(명목형) 변수이다.
  6) 두 모집단의 분포가 정규분포를 한다는 것을 가정한다. 
    : 1-표본 Kolmogorov-Smirnov검정, Shapiro-Wilk검정
  7) 두 집단이 독립적이어야 하며 분산이 같아야 한다.
    : Bartlett test, Hartley검정, Levene's test, 
 
 
 
 
 
*SPSS에서의 t-test
 : 분석 → 평균비교 → 독립표본 T검정(indipendent t-test) 또는 대응표본 T검정(Paired t-test)
  - 종속변수를 검정변수에, 독립변수를 집단변수에 옮겨 넣고 집단정의에 지정값을 입력한다음 계속, 확인
 

상관관계가 .745이므로 보통 상관관계이고 이때의 유의확률<0.001이므로 유의미하다. 대응표본 검정 즉 paired t-test에서 유의확률<0.05이므로 두 군의 차이는 유의미하고 두 군의 평균값이 Left가 더 크므로 Left측 통증이 유의미하게 더 크다고 해석할 수 있다.

 
 
 
 
 

반응형

 

 

2. 분산분석(ANOVA)

 
  1) 세 개 이상의 집단에서 모집단의 모평균 차이가 있는지 검정하고자 하는 경우
    : 3개 이상의 집단을 대상으로 A와B, B와C, C와A, 이와 같이 여러번 t-test를 하게 되면 실제로는 차이가 없는데도 영가설을 기가하게 되는 1종 오류를 범할 가능성이 높아진다. ☞ 이럴경우 본페로니 수정(Bonferroni's correction)을 하여 p값을 수정해야 한다.
 
      - 종속변수는 연속형 변수, 독립변수는 범주형(명목형) 변수
 
      - 정규분포 해야한다. (정규성)
 
      - 각 집단의 종속변수들은 동일한 분산을 가져야 한다. (등분산성)
 
      - 분석에 포함되는 집단들이 서로 독립적이어야 한다. 
: 서로 독립적이지 않거나 동일한 대상자를 반복측정 하는 경우에는 "반복측정에 의한 분산분석(repeated measures ANOVA)"방법을 적용해야한다.
  
  5) 일방향 분산분석(One-way analysis of variance, Factor 1(요인1 = 독립변수), 군내)
  : 독립적인 집단들에 대한 일방향 분산분석 방법, 특정한 종속변수에 대한 군 평균값들이 단일 요인(독립변수)에 노출되었을 때 통계학적으로 유의하게 다른지를 알아내는 데 사용된다.(정규성, 등분산성, 독립성 모두 성립하는 조건)
 

  • 적용하고자 하는 독립변수는 1개
  • 이 독립변수를 3개 이상의 집단에 적용
  • 종속변수 집단 간의 평균 차이를 분석
  • 집단 내 분산에 대하여 집단 간 분산을 비교하는 것: F=집단 간 분산/집단 내 분산
  • 영가설: 모든 평균이 동일하다
  • 영가설이 참일 경우, F-비율의 기대값은 1에 가깝다
  • 집단 간 분산이 집단 내 분산에 근거한 것보다 크다면 F값은 상대적으로 클 것이다.
  • F비가 크면 클수록 세 집단 내에 속한 대상자들의 점수가 우연이나 정상적인 변동을 넘어선 유의미한 차이라고 볼 수 있다.
  • F비 = F값 = F 통계량
  • 유의미한 차이가 있다고 결과가 나왔더라도 어느 평균치 간에 유의한 차이가 있는지를 ANOVA에서는 알 수 없다. 이를 알기 위해서는 사후비교(posterior comparison or post-hoc comparison)과정을 필요로 한다.

 
 
 
 
*SPSS에서의 일방향 분산분석
 : 분석 → 평균비교 → 일원배치 분산분석(옵션에서 '분산 동질성 검정'을 선택하면 등분산성 검정 같이 가능)
  - 입력된 자료들에서 종속변수에 해당하는 변수를  종속변수에, 독립변수에 해당하는 변수를 요인분석에 옮겨 넣은 다음 확인

예전에는 계산된 F비에대해 F분포표에서 유의수준과 자유도에 맞는 F비를 찾고 계산된 F비가 표에서 찾은 F비보다 클 때 통계적으로 집단 간의 평균들 중에서 유의한 차이가 있다고 해석했지만, 최근 통계프로그램을 사용하면서 유의 확률까지 알려주기때문에 F분포표를 직접 찾을 필요는 없어졌다.

 
: 위 테이블에서 F비는 29.395이고 유의확률 < 0.001이므로 영가설을 기각한다.
 
  6) 분산분석 후의 비교
분산분석은 집단간의 유의미한 차이가 있는지만 알 수 있으며 효과의 정도를 알고 싶다면 사후 검정(post-hoc)이 필요하다. 일단 F비가 유의하다고 나와야 사후검정을 할 수 있다.
 
< 통상적으로 많이 사용되는 사후검정 방법 >
(1) Tukey
(2) Newman-Keuls
(3) Bonferroni : 원래 정한 유의수준 / 비교의 수 ex) 0.05/6 (6가지 비교일 경우)
(4) Scheffe
(5) Duncan
 
어떤 사후검정 방법을 사용할 것인가는 pairwise or nonpairwise 비교 방법 선택 또는 1종 오류에 대하여 어느 정도를 보호받고 싶으냐에 따라 달라진다.
 
< 종속변수가 등분산성을 만족하지 못하는 경우 사후분석 다중비교 방법 >
(1) Tamhane의 T2
(2) Dunnett의 T3
(3) Games - Howell
(4) Dunnetrt의 C
 

728x90
반응형