구조방정식으로 데이터 분석의 질을 높이는 7가지 팁
_____A:
- 명확한 이론적 틀과 가설 설정: 선행연구를 통해 주요 개념(잠재변수)과 척도(관찰변수)를 정의
- 개념도(Conceptual Model) 작성: 변수 간 인과관계 흐름도를 그려 모델 식별 및 추정 방향을 명확히
- 변수 조작적 정의: 각 관찰변수의 문항·측정단위·응답척도를 일관성 있게 지정
2. Q: 표본 크기는 어느 정도가 적절한가요?
A:
- 권장 최소치: 표본크기(N) ≥ 200~300 또는 전체 자유도(df)×10배 이상
- N/파라미터 비율: 적어도 10:1 이상 유지(예: 추정 파라미터가 20개면 N≥200)
- 소표본 대책: 부트스트랩(bootstrap)으로 표준오차 추정, WLSMV 추정법 등 비정규·소표본 대응 기법 활용
3. Q: 측정모형(Confirmatory Factor Analysis) 신뢰도·타당도는 어떻게 검증하나요?
A:
- 신뢰도:
· 크론바흐 알파(α) ≥ 0.70
· 복합신뢰도(CR) ≥ 0.70
- 수렴타당도:
· AVE(평균분산추출) ≥ 0.50
· 요인부하량(λ) ≥ 0.50, 이상적으론 ≥ 0.70
- 판별타당도:
· 각 쌍별 AVE > 변수 간 제곱상관(φ²)
4. Q: 구조모형(Structural Model) 적합도를 평가하는 기준은 무엇인가요?
A:
- 카이제곱(χ²) / df ≤ 3
- CFI (Comparative Fit Index) ≥ 0.95
- RMSEA (Root Mean Square Error of Approximation) ≤ 0.06
- SRMR (Standardized Root Mean Square Residual) ≤ 0.08
→ 다수 지표를 종합해 해석하고, 표본크기나 모형 복잡도에 따른 한계 감안
5. Q: 모수추정 방법을 고를 때 유의할 점은 무엇인가요?
A:
- 표본·분포 조건 고려:
· 정규성 만족 시 → ML(Maximum Likelihood)
· 비정규 또는 범주형 변수 → MLR(robust ML), WLSMV
- 결측치 처리:
· FIML(Full Information ML)로 결측 무결성 최대 활용
- 모형 안정성 점검:
· 수렴(convergence) 여부, 표준오차(SE)의 합리적 크기 확인
6. Q: 수정지수(Modification Index)를 활용할 때 주의할 점은?
A:
- 이론적 근거 우선: 단순히 MI가 높다고 무조건 경로 추가 금지
- MI > 10일 때만 후보로 검토하고, 수정 전후 모델 비교
- 과도한 데이터 드리븐 수정 방지: 모형 과적합(overfitting)과 해석일관성 저해
7. Q: 다중집단 분석(Multi-group SEM)으로 집단 간 차이를 검증하려면 어떻게 하나요?
A:
1) 구성(invariance) 단계적 검정:
① 구성불변성(configural) → ② 측정불변성(metric) → ③ 절편불변성(scalar) → ④ 잔차불변성
2) 단계별 ΔCFI ≤ 0.01, ΔRMSEA ≤ 0.015 확인
3) 불변성 확보 시 잠재평균 및 구조계수 차이 검정으로 집단 간 효과 비교
표 형식 대신 설명 위주로 차근차근 살펴보겠습니다.
1. 이론 기반 모델 명확화 모든 SEM 분석은 견고한 이론적 토대 위에서 출발해야 합니다.
먼저 연구 문제와 선행연구를 통해 잠재변수(잠재요인)와 관측변수 간의 관계를 논리적으로 정립하세요.
예를 들어 “직무만족이 조직몰입에 미치는 영향”을 분석한다면, 직무만족과 조직몰입을 구성하는 하위차원(직무환경, 상사지원 등)뿐 아니라, 매개(예: 심리적 주인의식)나 조절변수(예: 성과급 제도)의 존재 여부도 이론적으로 뒷받침해야 합니다.
이 단계에서 명확해진 가설과 경로설정이 이후 분석의 방향타가 됩니다.
2. 충분한 표본크기 확보 및 검증 SEM은 파라미터 수(경로수·요인수·공분산수)에 비례해 요구되는 표본크기가 커집니다.
일반적으로 관측변수 1개당 10명 이상의 사례가 필요하다는 ‘10대1 규칙’을 최소 가이드라인으로 삼으세요.
보다 정확한 판단을 위해 몬테카를로 시뮬레이션으로 모수추정의 표준오차나 통계적 검정력(파워)을 미리 계산해보면 유용합니다.
표본이 부족하면 불안정한 추정값, 과대/과소 적합(fit) 결과가 나타날 수 있습니다.
3. 측정모델(CFA)로 신뢰도·타당도 확보 SEM의 핵심은 측정모델(Confirmatory Factor Analysis)입니다.
먼저 각 잠재변수를 대표하는 문항(관측변수)의 적재량(factor loading)을 보고 0.5(권장) 이상인지 확인하세요.
내적 일관성 신뢰도(Cronbach’s α 또는 합성신뢰도 composite reliability), 수렴타당도(AVE, 평균분산추출값), 판별타당도(잠재변수 간 AVE 상호비교)를 차례로 점검해 측정도구의 품질을 보증해야 합니다.
이 과정을 통해 불량 문항을 제거하거나 잠재구조를 재정의할 수 있습니다.
4. 모델 식별(identification)과 적절한 추정방법 선택 SEM을 해석하려면 모델이 식별(Identified)되어야 합니다.
즉, 자유도(degree of freedom)가 0보다 커야 하며, 잠재변수마다 적절한 스케일링(constraint) 작업이 이뤄져야 합니다.
일단 식별이 확보되면 자료 특성에 맞는 추정방법을 고르세요.
정규분포 가정을 충족한다면 최대우도추정(ML)이 표준이고, 비정규성·범주형 변수가 많다면 강건ML(MLR)이나 WLSMV(Weighted Least Squares Mean and Variance adjusted) 추정을 고려해야 합니다.
5. 누락값·비정규성 문제 사전 처리 실제 데이터에는 누락값(missing data)과 비정규성(non-normality)이 흔히 나타납니다.
SEM 패키지(Mplus, lavaan 등)가 제공하는 FIML(Full Information Maximum Likelihood)이나 다중대체법(multiple imputation)을 활용해 누락값을 처리하세요.
정규분포에서 크게 벗어나는 변수는 로그 변환·Box–Cox 변환 등을 고려하고, 여전히 비정규성이 남으면 부트스트랩(bootstrap)법으로 신뢰구간을 얻거나 강건 추정량(robust estimator)을 선택합니다.
6. 모델 적합도 평가 및 보완 SEM 결과 보고 시 글로벌 적합지수(χ2 검정, RMSEA, CFI, TLI, SRMR)를 검토하세요.
RMSEA < 0.06, CFI·TLI > 0.90(권장 0.9
5), SRMR < 0.08 등을 기준으로 삼되, χ2는 표본크기에 민감하므로 과도 의존을 피합니다.
국지적 부적합(local misfit)은 표준화 잔차(residual)나 수정지수(modification index)를 보고 살펴볼 수 있지만, 무분별한 경로 추가는 이론적 타당성을 훼손하니 주의해야 합니다.
경로 삭제·공분산 추가 등 수정은 반드시 이론적 근거와 선행연구를 바탕으로 결정하세요.
7. 검증적 분석과 다집단(invariance) 검토 개발된 SEM 모델의 일반화 가능성을 높이려면 교차검증(cross-validation) 절차가 필요합니다.
예비표본과 검증표본으로 나누어 모형을 반복 추정하거나, 부트스트랩 샘플로 안정성을 살펴보세요.
더 나아가 성별·연령·문화권 등 하위집단별 측정동등성(measurement invariance)을 검토하면, 집단 간 비교가 공정한지 확인할 수 있습니다.
구성불변성(configural), 약등가(invariant loadings), 강등가(invariant intercepts) 단계를 차례로 검정하여, 경로계수 차이가 실제 집단효과인지 통계적 산출물인지 구분해야 합니다.
이 일곱 가지 원칙을 SEM 분석 프로세스 전반에 걸쳐 꼼꼼히 적용하면, 모델의 타당성과 신뢰도를 크게 높이는 동시에 실제 현상을 정확히 반영하는 통찰력 있는 결과를 얻을 수 있습니다.
작성자:
김하윤 [비회원]
| 작성일자: 10개월 전
2025-07-22 06:03:05
조회수: 267 | 댓글: 0 | 좋아요: 0 | 싫어요: 0
조회수: 267 | 댓글: 0 | 좋아요: 0 | 싫어요: 0
내용이 부정확하다면 싫어요를 클릭해주세요.