
【C0094】PSM匹配MatchIt
经济学
管理科学
新闻传播
计量经济学与因果推断
R
PSM 匹配 (MatchIt) 简介
什么是 PSM?
倾向得分匹配(Propensity Score Matching, PSM)是一种统计学方法,用于在观察性研究中减少选择偏差。通过构建一个“倾向得分”(即个体接受处理的概率),将处理组和控制组中得分相似的个体进行配对,从而模拟随机对照试验的环境。
MatchIt 包的作用
MatchIt 是 R 语言中最流行的实现匹配算法的包。它支持多种匹配方法,包括:
- 最近邻匹配 (Nearest Neighbor):最常用,为每个处理组个体寻找得分最近的控制组个体。
- 卡钳匹配 (Caliper):限制匹配的最大距离,避免较差的匹配。
- 最优匹配 (Optimal):全局优化匹配距离总和。
- 完全匹配 (Full Matching):利用所有样本信息进行匹配。
本脚本流程
- 数据加载:使用
lalonde经典数据集。 - 模型设定:定义处理变量和协变量。
- 执行匹配:调用
matchit()函数进行 1:1 最近邻匹配。 - 结果提取:使用
match.data()获取匹配后的数据集供后续回归分析使用。 - 质量评估:通过
summary()查看匹配前后的标准化均值差,评估平衡性。