
【C0070】Poisson计数模型
经济学
会计金融
管理科学
计量经济学与因果推断
Stata
Poisson 计数模型简介
模型背景
泊松回归模型(Poisson Regression Model)是广义线性模型(GLM)的一种,专门用于处理非负整数计数数据(Count Data)。当因变量 $Y$ 表示单位时间内某事件发生的次数(如:每月事故数、每日就诊人数、网站点击量等)时,普通最小二乘法(OLS)往往不再适用,因为计数数据通常不服从正态分布,且方差随均值变化。
核心假设
该模型假设因变量 $Y$ 服从泊松分布,其概率质量函数为:
$$ P(Y=k) = \frac{e^{-\lambda} \lambda^k}{k!} $$
其中,$\lambda$ 是事件的平均发生率(即期望值 $E[Y]$)。
模型形式
为了将线性预测子与正值参数 $\lambda$ 联系起来,模型使用对数链接函数(Log Link):
$$ \ln(\lambda) = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k $$
或者写作:
$$ E[Y|X] = \exp(\beta_0 + \beta_1 X_1 + \dots + \beta_k X_k) $$
系数解释
- 系数 $\beta_j$:表示解释变量 $X_j$ 每增加一个单位,对数期望计数的变化量。
- 发生率比 (Incidence Rate Ratio, IRR):$\exp(\beta_j)$ 表示 $X_j$ 每增加一个单位,事件发生率的倍数变化。例如,若 $\exp(\beta_1) = 1.2$,则意味着 $X_1$ 每增加 1 单位,事件发生率平均增加 20%。
注意事项
- 过度离散 (Overdispersion):如果数据的方差显著大于均值($Var(Y) > E[Y]$),泊松模型的假设可能失效,此时应考虑使用负二项回归(Negative Binomial Regression)。
- 零膨胀 (Zero-inflation):如果数据中包含过多的零值,可能需要使用零膨胀泊松模型(ZIP)。