
【C0037】因果森林Causal Forest
经济学
计量经济学与因果推断
Python
因果森林 (Causal Forest)
概述
因果森林是一种基于随机森林的非参数方法,用于估计异质性处理效应(Heterogeneous Treatment Effects, HTE)。它由 Susan Athey 和 Guido Imbens 等人提出,能够识别不同个体特征下处理变量对结果变量的差异化影响。
核心原理
- 双重机器学习框架:通过残差化消除混淆变量影响
- 自适应分割:在构建树时优先选择能最大化处理效应异质性的特征分割点
- 诚实估计:将样本分为训练集和估计集,避免过拟合
适用场景
- 医疗领域:评估药物对不同患者亚群的效果差异
- 市场营销:分析促销活动对不同类型用户的转化影响
- 政策评估:研究教育干预对不同背景学生的效果
优势特点
- 无需预设函数形式
- 自动捕捉高阶交互效应
- 提供统计推断所需的方差估计
- 可解释性强(支持特征重要性分析)