
【C0020】Logit/Probit回归
经济学
管理科学
计量经济学与因果推断
Python
Logit/Probit 回归简介
核心概念
Logit 和 Probit 回归是用于处理二分类问题的广义线性模型,适用于因变量为二元离散值(如 0/1、是/否)的场景。
数学原理
- Logit 模型:使用逻辑函数(Sigmoid)作为链接函数
$$P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1X_1 + ... + \beta_kX_k)}}$$
- Probit 模型:使用标准正态分布累积分布函数作为链接函数
$$P(Y=1|X) = \Phi(\beta_0 + \beta_1X_1 + ... + \beta_kX_k)$$
主要区别
| 特性 | Logit | Probit |
|---|---|---|
| 链接函数 | 逻辑分布 | 正态分布 |
| 系数解释 | 优势比(Odds Ratio) | 潜变量变化 |
| 尾部概率 | 较厚尾 | 较薄尾 |
| 计算效率 | 略高 | 略低 |
应用场景
- 信用评分(违约/不违约)
- 医疗诊断(患病/健康)
- 营销响应(购买/不购买)
- 社会科学中的二元选择行为分析
代码实现说明
本实现包含:
- 使用 scikit-learn 进行快速建模和评估
- 使用 statsmodels 获取详细统计推断结果
- 同时展示 Logit 和 Probit 模型的对比
- 提供新样本的概率预测功能