
【C0059】Probit回归
经济学
会计金融
管理科学
计量经济学与因果推断
Stata
Probit 回归简介
什么是 Probit 回归?
Probit 回归(Probability Unit Regression)是一种用于处理二元因变量(Binary Dependent Variable,取值为 0 或 1)的广义线性模型。当我们要预测某个事件发生的概率时(例如:用户是否购买、贷款是否违约、病人是否康复),Probit 模型是一个非常经典的选择。
核心原理
与线性回归不同,Probit 回归不直接预测 Y 值,而是通过标准正态分布的累积分布函数(CDF),将线性组合映射到 (0, 1) 区间内。
模型公式如下:
$$ P(Y=1|X) = \Phi(\beta_0 + \beta_1 X_1 + \dots + \beta_k X_k) $$
其中:
- $P(Y=1|X)$ 是在给定自变量 $X$ 的情况下,事件发生的概率。
- $\Phi$ 代表标准正态分布的累积分布函数。
- $\beta$ 是需要估计的回归系数。
与 Logit 回归的区别
Probit 和 Logit 模型非常相似,主要区别在于链接函数的选择:
- Probit 假设误差项服从标准正态分布。
- Logit 假设误差项服从逻辑斯蒂分布(Logistic Distribution)。
在实际应用中,两者的结果通常非常接近。选择哪一个往往取决于学科习惯(经济学常用 Probit,生物统计和社会科学常用 Logit)或对尾部概率的特定假设。
本案例说明
本案例使用 Stata 内置的 auto 数据集,探究汽车的价格 (price) 和 重量 (weight) 如何影响该汽车是进口车 (foreign) 的概率。