구조방정식의 기초부터 고급까지: 7가지 필수 주제
_____Q1: 구조방정식모형의 정의는?
A1: 관측변수(observed variables)와 잠재변수(latent variables) 간의 인과·상관구조를 동시에 추정하는 통계모형. 요인분석(factor analysis)과 회귀분석(regression analysis)을 통합한 형태로, 측정모형(measurement model)과 구조모형(structural model)으로 구성된다.
Q2: SEM이 가지는 장점은?
A2:
1. 측정오차(error)를 명시적으로 처리하여 모수 추정의 편향 최소화
2. 다수의 종속변수 간 상호작용 및 간접효과(indirect effect) 분석 가능
3. 이론적 모형을 직접 검증(confirmatory)할 수 있어 가설검증에 유리
[주제 2] 측정모형과 확인적 요인분석(CFA)
Q1: 측정모형(measurement model)이란?
A1: 잠재변수와 이를 대표하는 관측변수 간 관계를 정의한 부분. 잠재변수를 요인(factor)으로, 관측변수를 지표(indicator)로 두고 요인부하량(factor loading)을 추정한다.
Q2: 확인적 요인분석(CFA)과 탐색적 요인분석(EFA)의 차이는?
A2:
• EFA: 요인 수와 구조를 사전에 모르는 상태에서 데이터가 스스로 구조를 드러내도록 탐색
• CFA: 이론적 가설에 따라 요인수를 고정하고 어떤 관측변수가 어떤 요인에 속하는지 미리 지정
[주제 3] 구조모형(path analysis)과 인과효과
Q1: 구조모형이란 무엇인가?
A1: 잠재·관측변수 간의 인과경로(path)를 설정해 직접효과(direct effect), 간접효과(indirect effect), 총효과(total effect)를 추정하는 부분. 예컨대 X→M→Y 형태의 매개모형(mediation model) 등이 여기에 속한다.
Q2: 직접효과와 간접효과는 어떻게 구분하는가?
A2:
• 직접효과: X가 Y에 미치는 경로계수(예: γXY)
• 간접효과: X→M→Y처럼 중간변수를 거쳐 전달된 효과(예: γXM×βMY)
• 총효과: 직접효과 + 간접효과의 합
[주제 4] 모형식별(Identification)
Q1: 식별 가능성(identification)이란?
A1: 주어진 데이터로부터 모든 모수(parameter)를 고유하게 추정할 수 있는지 여부. 식별되지 않은 모형은 해(解)가 무한대이거나 추정 불가능하다.
Q2: 식별문제 해결 방법은?
A2:
1. 최소제약조건: 식별된(confirmatory) 잠재변수당 최소 3개 이상의 관측지표 확보
2. 모수 고정: 하나의 요인부하량을 1로 고정하거나 잠재변수 분산을 1로 설정
3. 불필요경로 제거: 모형을 단순화해 자유도(degree of freedom) 확보
Q1: 주요 추정방법은 어떤 것이 있는가?
A1:
• 최대우도법(Maximum Likelihood, ML): 정규분포 가정하에 효율적 추정
• 최소분산법(Generalized Least Squares, GLS)
• 가중최소제곱법(Weighted Least Squares, WLS): 비연속·범주형 지표 사용 시
Q2: SEM에서 주의해야 할 주요 가정은?
A2:
• 다변량정규성(multivariate normality)
• 선형성(linearity)
• 관측치 독립성(independence of observations)
• 결측치 처리(missing data)에 대한 적절한 보정
[주제 6] 모형 적합도 평가와 비교
Q1: 대표적인 적합도 지수(fit indices)에는 어떤 것이 있는가?
A1:
• 카이제곱검증(χ²): 모형과 자료 간 차이 검정
• CFI(Comparative Fit Index), TLI(Tucker–Lewis Index)
• RMSEA(Root Mean Square Error of Approximation)
• SRMR(Standardized Root Mean Square Residual)
Q2: 모형 간 비교는 어떻게 하는가?
A2:
• AIC(Akaike Information Criterion), BIC(Bayesian Information Criterion) 등 정보기준 사용
• χ² 차이검정(χ² difference test)으로 중첩모형(nested model) 비교
[주제 7] 고급주제: 다집단분석·잠재성장모형·모형수정
Q1: 다집단 SEM(Multi‐group SEM)이란?
A1: 성별·문화권·시기 등 서로 다른 그룹(group) 간 모수(요인부하량·경로계수 등)의 동등성(equivalence)을 검증하는 기법. 집단 간 불변성(invariance)을 단계별(형태, 부하량, 절편 등)로 검사한다.
Q2: 잠재성장모형(Latent Growth Curve Model)이란?
A2: 횡단면이 아닌 종단면(longitudinal) 데이터를 이용해 시간에 따른 잠재변수의 기울기(slope)와 절편(intercept)을 추정. 개인별 성장 궤적(individual trajectories)을 분석할 수 있다.
Q3: 모형수정(modification) 절차는?
A3:
1. 수정지수(modification indices) 확인
2. 이론적 타당성 검토 후 경로 추가·삭제
3. 과도한 데이터맞춤(overfitting) 방지를 위해 최소한으로 수정
아래에서는 기초 개념부터 고급 응용까지 7가지 핵심 주제를 글로만 자세히 다룹니다.
1. SEM의 기본 개념과 장점 SEM은 관측변수(observed indicators)가 내재된 잠재변수(latent constructs)를 측정하는 ‘측정모형(Measurement Model)’과, 이러한 잠재변수들 간 인과적 구조를 검증하는 ‘구조모형(Structural Model)’으로 구성됩니다.
회귀분석이나 ANOVA가 관측변수 간 관계만 다루는 데 비해, SEM은 측정오차를 명시적으로 모델링함으로써 추정치의 편향을 줄이고, 복잡한 매개·중재 관계를 동시에 검정할 수 있다는 점이 장점입니다.
또한 잠재변수의 개념적 타당도를 평가하는 확인적 요인분석(CFA)과 인과모형 검증을 통합함으로써 연구 가설의 정교한 검증이 가능합니다.
2. 측정모형: 확인적 요인분석(CFA) 측정모형 단계에서는 각 잠재변수를 대표하는 복수의 관측변수를 지정하고, 요인부하량(factor loadings)·측정오차(uniqueness)를 추정합니다.
모델이 식별(identification)되려면 “자유매개변수 수 ≥ 관측분산·공분산 수” 조건을 만족해야 합니다.
모수 제약(예: 요인부하량 하나를 1로 고정)으로 잠재변수의 척도를 명시하고, 모형 적합도 지표(CFI, TLI, RMSEA, SRMR 등)를 통해 타당도를 평가합니다.
만약 특정 항목의 부하량이 낮거나 잔차 간 상관이 크게 나타나면, 모형 수정지수(Modification Index)를 참고해 항목 제거·오차공분산 추가 등을 고려합니다.
3. 구조모형: 인과경로 설정과 가설 검증 구조모형에서는 잠재변수 간 선형회귀방정식(경로계수)을 지정하여 인과관계를 규명합니다.
직접효과(direct effect)·간접효과(indirect effect)·총효과(total effect)를 동시에 추정하며, 표본크기가 충분할 때 부트스트랩(bootstrap) 기법으로 간접효과의 유의성을 검정할 수 있습니다.
모형 지정 단계에서 이론적 근거가 우선이며, 불필요한 경로를 제거 혹은 추가하면서 단순·명료한 인과구조를 구축하는 것이 중요합니다.
4. 식별(Identification) 이슈 SEM 모형이 제대로 추정되기 위해서는 식별가능성이 보장되어야 합니다.
기본적으로 잠재변수당 최소 3개 이상의 지표변수가 있고, 측정모형·구조모형 각각에서 모수의 개수와 관측치 수(분산·공분산 수)를 비교해야 합니다.
부분식별(overidentification)이면 자유매개변수들을 추정할 수 있고, 정식별(just-identification)은 모수 수가 방정식 수와 같아 적합도 지표가 0으로 고정되므로 실제 검정에는 부적합합니다.
5. 모수 추정 방법 가장 널리 쓰이는 최대우도법(Maximum Likelihood, ML)은 정규성 가정 하에서 효율적이지만, 표본크기가 작거나 관측변수가 비정규 분포일 때는 GLS, WLS, MLR(robust ML) 등을 활용합니다.
특히 범주형 지표변수(리커트 척도)일 경우 WLSMV(weighted least squares mean and variance adjusted)가 권장됩니다.
베이지안 추정(Bayesian SEM)은 사전분포(prior)를 활용해 소표본이나 식별이 불완전한 모델에서도 안정적인 추정치를 제공하며, MCMC 알고리즘을 통해 후분포(posterior)를 샘플링합니다.
6. 모형 적합도 평가 및 수정 모형 적합도는 전역적합도 지표(CFI, TLI, RMSEA, SRMR 등)와 국부적합도(잔차, 수정지수)를 함께 검토해야 합니다.
일반적으로 CFI·TLI ≥ 0.90(이상), RMSEA ≤ 0.08(바람직하게는 ≤ 0.0
6), SRMR ≤ 0.08 기준을 준수합니다.
경로계수의 표준화 추정치 크기와 유의확률(p-value)을 확인하고, 설명변량(R²)이 지나치게 낮으면 모형 수정(제거·추가·제약 변경)을 고려합니다.
다만 지나친 수정은 이론적 정당성을 해칠 수 있으므로 주의해야 합니다.
7. 고급 응용: 다집단분석·잠재성장·비정규·베이지안 (1) 다집단 SEM(Multigroup SEM): 성별·연령·문화권 간 측정동등성(구성·척도·잔차 등)을 단계별로 검정한 뒤 경로계수의 차이를 비교해 집단 간 구조적 차이를 분석합니다.
(
2) 잠재성장모형(Latent Growth Curve Modeling): 반복측정자료에서 개인별 성장 궤적(초기치·변화량)을 잠재변수로 규명하고, 이들 간 회귀·상관을 추정해 성장 패턴을 비교합니다.
(
3) 비정규·결측 데이터 처리: 표본 비정규성을 고려한 robust 추정치나 다중대체법(Multiple Imputation)을 통해 결측치를 보완하고, 가중치를 적용한 분석으로 일반화가능성을 확보합니다.
(
4) 베이지안 SEM: 사전정보를 반영해 복잡·소표본 모델을 안정적으로 추정하며, DIC, posterior predictive p-value 등을 이용해 적합도를 평가합니다.
이처럼 SEM은 이론적 타당도와 통계적 엄밀성을 결합하여 사회·경영·심리·교육 등 다양한 분야에서 복합 인과관계를 검증하는 데 필수적인 도구입니다.
각 단계마다 이론적 근거를 중시하고, 적절한 추정·검정 방법을 선택해야 신뢰도 높은 결과를 얻을 수 있습니다.
작성자:
박시현 [비회원]
| 작성일자: 10개월 전
2025-07-22 06:03:45
조회수: 208 | 댓글: 0 | 좋아요: 0 | 싫어요: 0
조회수: 208 | 댓글: 0 | 좋아요: 0 | 싫어요: 0
내용이 부정확하다면 싫어요를 클릭해주세요.