【C0059】Probit回归

经济学 会计金融 管理科学
计量经济学与因果推断
Stata
时间图标 2026-03-09
高级

Probit 回归简介

什么是 Probit 回归?

Probit 回归(Probability Unit Regression)是一种用于处理二元因变量(Binary Dependent Variable,取值为 0 或 1)的广义线性模型。当我们要预测某个事件发生的概率时(例如:用户是否购买、贷款是否违约、病人是否康复),Probit 模型是一个非常经典的选择。

核心原理

与线性回归不同,Probit 回归不直接预测 Y 值,而是通过标准正态分布的累积分布函数(CDF),将线性组合映射到 (0, 1) 区间内。

模型公式如下:
$$ P(Y=1|X) = \Phi(\beta_0 + \beta_1 X_1 + \dots + \beta_k X_k) $$

其中:

  • $P(Y=1|X)$ 是在给定自变量 $X$ 的情况下,事件发生的概率。
  • $\Phi$ 代表标准正态分布的累积分布函数。
  • $\beta$ 是需要估计的回归系数。

与 Logit 回归的区别

Probit 和 Logit 模型非常相似,主要区别在于链接函数的选择:

  • Probit 假设误差项服从标准正态分布
  • Logit 假设误差项服从逻辑斯蒂分布(Logistic Distribution)。

在实际应用中,两者的结果通常非常接近。选择哪一个往往取决于学科习惯(经济学常用 Probit,生物统计和社会科学常用 Logit)或对尾部概率的特定假设。

本案例说明

本案例使用 Stata 内置的 auto 数据集,探究汽车的价格 (price)重量 (weight) 如何影响该汽车是进口车 (foreign) 的概率。

下载代码
兑换码获取图标 兑换码获取
文件名称: C0059.zip
文件大小: 0MB
更新时间: 2026-03-09