[인과추론] 표준오차에 대하여
표준오차에 대하여 알아보자 :)
CATE 예측 평가하는 방법에 대해 알아보자 :)
(공변량 변수)에 따른 집단의 평균 처치 효과공변량 변수의 예) 성별, 나이, 소득 수준 등train = data.query("day<'2018-01-01'") test = data.query("day>='2018-01-01'")
X = ["C(month)", "C(weekday)", "is_holiday", "competitors_price"] regr_model = smf.ols(f"sales ~ discounts*({'+'-join(X)})", data=train).fit() cate_pred = (regr_model.predict(test.assign(discounts=test["discounts"]+1)) - regr_model.predict(test))
sales 예측from sklearn.ensemble import GradientBoostingRegressor x = ["month", "weekday", "is_holiday", "competitors_price", "discounts"] y = "sales" np.random.seed(1) ml_model = GradientBoostingRegressor(n_estimators=50).fit(train[x], train[y]) # 단순 결과 ml_pred = ml_model.predict(test[x])
np.random.seed(123) test_pred = test.assign( ml_pred=ml_pred, cate_pred=cate_pred, rand_m_pred=np.random.uniform(-1, 1, len(test)) )