[인과추론] 통제집단합성법과 수평 회귀분석

통제집단합성법과 수평회귀분석에 대해 알아보자 :)

Jan 13, 2025

Q1. 통제집단합성법이란?

정의 : 연구나 실험에서 통제 집단(control group)과 실험 집단(experimental group) 간의 비교를 더 정확하게 하기 위해 사용하는 방법
핵심 개념 : 처치 이전 기간을 사용하여 대조군을 결합함으로써 실험군의 평균 결과를 잘 근사할 수 있는 방법을 찾는 것
ω^sc=argminωyˉpre,trYpre,coωco2\hat{\omega}^{s c}=\underset{\omega}{\operatorname{argmin}}\left\|\bar{y}_{p r e, t r}-Y_{p r e, c o} \omega_{c o}\right\|^2
  1. 목표:
      • 최적화된 가중치 벡터 : ω^sc\hat{\omega}^{s c}
        • : 실험군의 결과와 통제 집단의 결과를 조정하여 최대한 유사하게 만드는 가중치를 나타냄
  1. 최적화 문제:
      • 목표 함수 : yˉpre,trYpre,coωco2\left\|\bar{y}_{p r e, t r}-Y_{p r e, c o} \omega_{c o}\right\|^2
      • 목표: 이 제곱 오차를 최소화하는 가중치 벡터 ω\omega를 찾는 것이 목표
        • → 즉, 통제 집단의 전처치 결과를 가중치 벡터를 이용하여 조정했을 때 실험군의 전처치 결과와 최대한 유사하게 만드는 가중치 벡터를 찾는 것
  1. 설명:
      • yˉpre,tr\bar{y}_{p r e, t r} : 실험군의 전처치 평균 결과를 나타냅니다.
      • Ypre,coY_{p r e, c o} : 통제 집단의 전처치 결과를 나타냅니다.
      • ωco\omega_{c o} : 통제 집단의 전처치 결과에 적용할 가중치를 나타냅니다.
      • ω^sc\hat{\omega}^{s c} : 이 최적화 문제를 해결하여 얻은 최적의 가중치 벡터입니다.

Q2. 선형회귀분석과 비교해본다면?

  1. 목표
      • 공변량 X와 결과 Y 간의 선형 관계를 모델링하고, 이 선형 모델을 통해 결과를 예측하는 것.
  1. 최적화 문제
      • 회귀 분석에서는 결과 Y와 공변량 X 간의 선형 조합으로 결과를 예측하고, 이 예측과 실제 결과 간의 제곱 오차를 최소화
        • → 이 과정은 가중치 또는 회귀 계수를 추정하는 것
통제집단합성법
선형회귀분석
정의
실험 집단의 전처치 결과와 통제 집단의 전처치 결과를 맞추기 위해 가중치를 조정
결과 𝑌를 공변량
𝑋의 선형 조합으로 모델링하고, 회귀 계수를 추정하여 결과를 예측
목표
통제 집단의 결과에 가중치를 곱하여 실험 집단의 결과와 비슷하게 만드는 것
예측 결과와 실제 결과 간의 제곱 오차를 최소화하는 것

Q. OLS(최소제곱법)을 사용하여 가상의 대조군을 만들어보면?

notion image
notion image
  1. 설명
      • y_pre_co : 공변량 X 행렬
      • y_pre_tr.mean(axis=1) : 결과 Y
      • model.coef_ : 가중치(=회귀계수)
      • y0_tr_hat : 가상의 대조군(=처치 받지 않았을 때 실험군의 평균적인 행동을 근사하기 위한 것)
notion image
통제집단합성법(=수평회귀분석)
선형회귀분석
사용 시간
실험 규모가 작지만 시간 범위가 길 때
실험 대상이 많을 때
실험 대상
공변량
행(시간)

Q4. 가상의 대조군을 포함한 결과는?

notion image
가상의 대조군(예측된 값)이 실험군의 실제 결과보다 낮음
→ 실제 결과가 처치 받지 않았다면, 실험군의 실제 결과보다 높을 것
가상의 대조군(예측된 값)
실험군
처치 유무
X
O
특징
실험군 평균 행동 근사 위한 것
실험군 실제
실험군이 처치를 받지 않았다면, 가상의 대조군의 결과가 높을 것

Q5. 관측된 결과와 가상의 대조군에 대한 결과를 비교해서ATT 추정을 해보면?

notion image
결과
  • 효과가 정점에 이르기까지 일정 시간이 걸리며, 그 후 점차 줄어듦.
    • 예) 마케팅에서는 광고를 본 후 사람들이 행동으로 옮기기까지 시간이 필요하고, 이후 효과가 서서히 사라지는 신기 효과가 발생함.
  • 개입 이전 기간의 ATT(OLS 모델의 잔차)가 0에 가까우면 좋음.
    • → 하지만 믿을 수 없을 정도로 낮다면, OLS 모델이 과적합되었을 수 있음을 의미.