본문 바로가기
연구방법론

대상자 동질성 분석(SPSS)

by Potatoing 2025. 3. 27.
728x90
반응형

대상자는 110명

남성 59명

여성 51명

 

이때 남성의 나이 평균과 여성의 나이 평균을 구하고 나이에서 남여 그룹의 동질성 차이가 있는지 보려고 한다.

 

SPSS에서

분석 → 평균비교 → 독립표본T검정

① 검정변수에 '나이'

② 집단변수에 '성별' → 집단정의

③ 확인

 

 

남성의 나이 평균은 24.95세 ± 4.63

여성의 나이 평균은 23.51세 ± 3.30

 

그런데 Levene의 등분산 검정을 보면 유의확률이 0.027 즉 0.05보다 낮은 값으로 등분산을 가정하지 않는다.

 

◈ 유의 수준이 0.05 미만이면 차이가 없는데 차이가 있다고 할 가능성이 매우 낮으므로 차이가 있다고 본다. 쉽게 말해서 유의 확률이 0.05 미만이면 두 군 간에 유의미한 차이가 있다고 보는데, '차이가 있다'는 인식을 이용해서 등분산에서 유의 확률이 0.05 미만이니까 여기서도 '차이가 있다' 즉 '등분산 하지 않는다'라고 생각하면 된다. 

 

그럼 이제 독립표본 검정 표에서 아래 줄에 있는 등분산을 가정하지 않을 때의 값을 보면 된다.

그런데 유의 확률에 단측 확률과 양측확률이 0.030 : 0.061로 어느 것을 볼지에 따라 0.05 미만인지 이상인지 달라지므로 유의한 차이가 있는지 없는지 결과 해석이 달라지게 된다. 

 

"남/여 두 군에서 나이에 차이가 있는지 보려는 것"

= 어느 성별이 더 나이가 많을 것이다 or 적을 것다라는 방향성을 가지지 않음 (방향성 가지면 단측 확률 봐야함)

★따라서 유의 확률은 "양측 확률"을 봐야한다.

 

양측 확률 0.061로 남/여 그룹의 평균 나이에 유의미한 차이가 없다. 라고 해석


< 효과 크기 >

위에서 알게된 유의 확률(p-value)는 차이가 있느냐 없느냐만 알려주기 때문에

- 그 차이가 얼마나 큰가?

- 실제로 임상적 의미가 있는가?

- 샘플 수만 많아서 유의미하게 나온 건 아닐까?

이것들을 알기위해 효과크기를 봐야한다.

 

지표 사용 기준 계산 방식 추천상황
Cohen's d 가장 널리 쓰임 두 집단의 결합표준편차 사용 두 집단 표본 수와 분산이 비슷할 때
Hedges' g(수정) Cohen's d 보정 d에 작은 샘플 보정을 적용 - 표본 수가 작을 때 더 정확
- 등분산이 조금 깨졌더라도 샘플 수가 비슷할 때
Glass's 델타 한쪽 집단의 SD 사용 보통 대조군의 표준편차 사용 - 두 집단의 분산이 많이 다를 때 (등분산X)
- 대조군과 실험군을 비교하는 것 처럼 차이가 명확할 때

 

입력된 데이터에서 남 59명 여 51명으로 샘플수는 비슷하지만 등분산은 하지 않으며 대조군/ 실험군 처럼 임상 시험은 아니므로 Hedges' g를 보는 것이 적절하다. 

 

따라서 이 데이터의 효과크기는 0.351로 작음~중간 정도의 효과를 나타낸고 해석할 수 있다.

 

 

결론

남성과 여성간의 평균 나이차이는 통계적으로 유의미하지 않았으나(p = 0.061), 효과크기(Hedges' g = 0.351)는 간 수준으로 실제 차이가 존재할 가능성을 완전히 배재할 수는 없지만, 연구 해석에 있어 큰 영향은 없을 것으로 판단된다. 

728x90
반응형