【C0070】Poisson计数模型

经济学 会计金融 管理科学
计量经济学与因果推断
Stata
时间图标 2026-03-09
高级

Poisson 计数模型简介

模型背景

泊松回归模型(Poisson Regression Model)是广义线性模型(GLM)的一种,专门用于处理非负整数计数数据(Count Data)。当因变量 $Y$ 表示单位时间内某事件发生的次数(如:每月事故数、每日就诊人数、网站点击量等)时,普通最小二乘法(OLS)往往不再适用,因为计数数据通常不服从正态分布,且方差随均值变化。

核心假设

该模型假设因变量 $Y$ 服从泊松分布,其概率质量函数为:
$$ P(Y=k) = \frac{e^{-\lambda} \lambda^k}{k!} $$
其中,$\lambda$ 是事件的平均发生率(即期望值 $E[Y]$)。

模型形式

为了将线性预测子与正值参数 $\lambda$ 联系起来,模型使用对数链接函数(Log Link):
$$ \ln(\lambda) = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k $$
或者写作:
$$ E[Y|X] = \exp(\beta_0 + \beta_1 X_1 + \dots + \beta_k X_k) $$

系数解释

  • 系数 $\beta_j$:表示解释变量 $X_j$ 每增加一个单位,对数期望计数的变化量。
  • 发生率比 (Incidence Rate Ratio, IRR):$\exp(\beta_j)$ 表示 $X_j$ 每增加一个单位,事件发生率的倍数变化。例如,若 $\exp(\beta_1) = 1.2$,则意味着 $X_1$ 每增加 1 单位,事件发生率平均增加 20%。

注意事项

  • 过度离散 (Overdispersion):如果数据的方差显著大于均值($Var(Y) > E[Y]$),泊松模型的假设可能失效,此时应考虑使用负二项回归(Negative Binomial Regression)。
  • 零膨胀 (Zero-inflation):如果数据中包含过多的零值,可能需要使用零膨胀泊松模型(ZIP)。
下载代码
兑换码获取图标 兑换码获取
文件名称: C0070.zip
文件大小: 0MB
更新时间: 2026-03-09