대상자는 110명
남성 59명
여성 51명
이때 남성의 나이 평균과 여성의 나이 평균을 구하고 나이에서 남여 그룹의 동질성 차이가 있는지 보려고 한다.
SPSS에서
분석 → 평균비교 → 독립표본T검정
① 검정변수에 '나이'
② 집단변수에 '성별' → 집단정의
③ 확인
남성의 나이 평균은 24.95세 ± 4.63
여성의 나이 평균은 23.51세 ± 3.30
그런데 Levene의 등분산 검정을 보면 유의확률이 0.027 즉 0.05보다 낮은 값으로 등분산을 가정하지 않는다.
◈ 유의 수준이 0.05 미만이면 차이가 없는데 차이가 있다고 할 가능성이 매우 낮으므로 차이가 있다고 본다. 쉽게 말해서 유의 확률이 0.05 미만이면 두 군 간에 유의미한 차이가 있다고 보는데, '차이가 있다'는 인식을 이용해서 등분산에서 유의 확률이 0.05 미만이니까 여기서도 '차이가 있다' 즉 '등분산 하지 않는다'라고 생각하면 된다.
그럼 이제 독립표본 검정 표에서 아래 줄에 있는 등분산을 가정하지 않을 때의 값을 보면 된다.
그런데 유의 확률에 단측 확률과 양측확률이 0.030 : 0.061로 어느 것을 볼지에 따라 0.05 미만인지 이상인지 달라지므로 유의한 차이가 있는지 없는지 결과 해석이 달라지게 된다.
"남/여 두 군에서 나이에 차이가 있는지 보려는 것"
= 어느 성별이 더 나이가 많을 것이다 or 적을 것다라는 방향성을 가지지 않음 (방향성 가지면 단측 확률 봐야함)
★따라서 유의 확률은 "양측 확률"을 봐야한다.
양측 확률 0.061로 남/여 그룹의 평균 나이에 유의미한 차이가 없다. 라고 해석
< 효과 크기 >
위에서 알게된 유의 확률(p-value)는 차이가 있느냐 없느냐만 알려주기 때문에
- 그 차이가 얼마나 큰가?
- 실제로 임상적 의미가 있는가?
- 샘플 수만 많아서 유의미하게 나온 건 아닐까?
이것들을 알기위해 효과크기를 봐야한다.
지표 | 사용 기준 | 계산 방식 | 추천상황 |
Cohen's d | 가장 널리 쓰임 | 두 집단의 결합표준편차 사용 | 두 집단 표본 수와 분산이 비슷할 때 |
Hedges' g(수정) | Cohen's d 보정 | d에 작은 샘플 보정을 적용 | - 표본 수가 작을 때 더 정확 - 등분산이 조금 깨졌더라도 샘플 수가 비슷할 때 |
Glass's 델타 | 한쪽 집단의 SD 사용 | 보통 대조군의 표준편차 사용 | - 두 집단의 분산이 많이 다를 때 (등분산X) - 대조군과 실험군을 비교하는 것 처럼 차이가 명확할 때 |
입력된 데이터에서 남 59명 여 51명으로 샘플수는 비슷하지만 등분산은 하지 않으며 대조군/ 실험군 처럼 임상 시험은 아니므로 Hedges' g를 보는 것이 적절하다.
따라서 이 데이터의 효과크기는 0.351로 작음~중간 정도의 효과를 나타낸고 해석할 수 있다.
결론
남성과 여성간의 평균 나이차이는 통계적으로 유의미하지 않았으나(p = 0.061), 효과크기(Hedges' g = 0.351)는 간 수준으로 실제 차이가 존재할 가능성을 완전히 배재할 수는 없지만, 연구 해석에 있어 큰 영향은 없을 것으로 판단된다.
'연구방법론' 카테고리의 다른 글
상관계수(correlation coefficient); 피어슨 상관계수, 스피어맨 상관계수, 회귀분석 (0) | 2024.07.01 |
---|---|
다중비교(multiple comparison)와 반복측정 분산분석(Repeated ANOVA) (0) | 2024.06.20 |
추측통계학: t-검정(t-test)과 분산분석(ANOVA) (0) | 2024.06.20 |
G*power와 검정력(power)과 표본크기(Power and sample size) (0) | 2024.06.20 |
가설검정(Hypothesis testing or significance testing)과 가설검정의 오류 (0) | 2024.06.20 |