前置知识:双重差分法 DID、合成控制法、双向固定效应 TWFE
前置算法回顾
已知双重差分法 DID 的线性模型可表示如下: $$ Y_{it} = \beta_0 + \beta_1 Post_t + \beta_2 Treated_i + \beta_3 Treated_i Post_t + e_{it} $$
- 其中
post表示时间虚拟变量,treated表示干预虚拟变量
而通过引入个体/时间的固定效应,可以将 DID 表示为 TWFE 的形式: $$ \hat{\tau}^{did} = \underset{\mu, \alpha, \beta, \tau}{argmin} \bigg{ \sum_{i=1}^N \sum_{t=1}^T \big(Y_{it} - (\mu + \alpha_i + \beta_t + \tau D_{it}\big)^2 \bigg} $$
- 其中 $\alpha_i$ 表示个体固定效应,$\beta_{t}$ 表示时间固定效应
- TWFE 可以通过借助 DML 的思想来快速估计干预效应
合成控制法则需要先寻找最优的权重来组合样本,使数据满足平行趋势假设;其具体的建模过程,可以表述为一下形式(为例方便与 TWFE 对比分析): $$ \hat{\tau}^{sc} = \underset{\beta, \tau}{argmin} \bigg{ \sum_{i=1}^N \sum_{t=1}^T \big(Y_{it} - \beta_t - \tau D_{it}\big)^2 \hat{w}^{sc}_i \bigg} $$
- 相比于TWFE,合成控制法额外考虑了个体权重 $\hat{w}^{sc}_i$,但并没有考虑到个体固定效应 $\alpha_i$ 和总体截距 $\mu$,仅考虑到了时间固定效应$\beta_{t}$
合成双重差分法
合成双重差分法(Synthetic Diff-in-Diff,SDID)的公式定义如下: $$ \hat{\tau}^{sdid} = \underset{\mu, \alpha, \beta, \tau}{argmin} \bigg{ \sum_{i=1}^N \sum_{t=1}^T \big(Y_{it} - (\mu + \alpha_i + \beta_t + \tau D_{it})^2 \hat{w}^{sdid}_i \hat{\lambda}^{sdid}_t \big) \bigg} $$
- SDID 可以简单理解为在 DID 中添加合成控制法拟合的个体/时间权重
- SDID 也可以理解为在合成控制法估计量中额外考虑个体的固定效应
- $\hat{w}^{sdid}_i$ 表示个体权重,用于最小化对照组与干预组之间的个体均值差异
- $\hat{\lambda}^{sdid}_t$ 表示时间权重,用于最小化干预组在干预前后之间的时间均值差异
时间权重 $\hat{\lambda}^{sdid}_t$ 的计算公式如下:
$$
\hat{\lambda}^{sdid} = \underset{\lambda}{\mathrm{argmin}} \ ||\bar{\pmb{y}}_{post, co} - (\pmb{\lambda}_{pre} \pmb{Y}_{pre, co} + \lambda_0)||^2_2 \
\text{s.t } \ \sum \lambda_t = 1 \text{ and } \ \lambda_t > 0 \ \forall \ t
$$
- 相比于合成控制法,SDID 允许不同时间段的结果存在常数差异,只需要趋势相关即可;因此 SDID 引入了截距项 $\lambda_0$ ;一般来说,距离干预的时间点越近,时间权重 $\hat{\lambda}^{sdid}_t$ 会越大
个体权重 $\hat{w}^{sdid}_i$ 的计算公式如下:
$$
\hat{w}^{sdid} = \underset{w}{\mathrm{argmin}} \ ||\bar{\pmb{y}}_{pre, tr} - (\pmb{Y}_{pre, co} \pmb{w}_{co} + w_0)||^2_2 + \zeta^2 T_{pre} ||\pmb{w}_{co}||^2_2\
\text{s.t } \ \sum w_i = 1 \text{ and } \ w_i > 0 \ \forall \ i
$$
- 相比于合成控制法,SDID 允许不同组之间存在常数差异,只需要趋势平行即可;因此 SDID 引入了截距项 $w_0$;此外,SDID 还引入了 Ridge 回归的正则化项 $\zeta^2$ 来减少估计的方差,让权重分散,防止权重集中在某个个体上(避免过拟合)
SDID 的分析
- 融合 TWFE 和合成控制法的优势,稳定且效果好
- 当平行趋势假设成立时,SDID 会退化成 DID
- 当合成控制法的拟合效果好时,SDID 的结果也很好
- SDID 只需要加权后的数据满足平行趋势假设