
【C0033】断点回归RDD
经济学
计量经济学与因果推断
Python
断点回归 (Regression Discontinuity Design, RDD)
什么是断点回归?
断点回归设计 (RDD) 是一种准实验方法,用于评估干预措施或政策的因果效应。它适用于这样一种情境:是否接受处理(Treatment)完全取决于某个连续变量(称为“运行变量”或“评分变量”,Running Variable)是否超过特定的阈值(断点,Cutoff)。
核心逻辑
在断点附近,个体是否可以被视为是随机分配的。因为对于非常接近阈值的个体来说,他们稍微高一点或低一点往往带有随机性(例如考试分数 59.5 分和 60.5 分)。因此,比较断点两侧紧邻的个体的结果差异,可以无偏地估计处理效应。
本代码功能说明
main.py 脚本实现了以下功能:
- 数据生成:模拟创建一个符合 Sharp RDD 特征的数据集。其中,当运行变量 $X \ge 0$ 时,个体接受处理 ($T=1$),否则不接受 ($T=0$)。
- 模型估计:采用局部线性回归方法,仅选取断点附近(带宽范围内)的数据进行拟合。
- 效应计算:通过回归模型中处理变量 $T$ 的系数,估算出断点处的跳跃幅度,即因果效应。
适用场景
- 奖学金评定(分数线以上获得奖学金)
- 政策补贴(收入低于某标准获得补贴)
- 医疗干预(指标高于某阈值进行治疗)