
【C124】基于 SARIMA、XGBoost 和 LSTM 的出租车乘客量预测系统
理工医
机器学习与深度学习
Python
本项目围绕出租车乘客量预测任务展开,构建了一个结合 SARIMA、XGBoost 和 LSTM 的多阶段集成预测系统。出租车需求具有明显的时间周期性,同时又受到天气、距离、费用、小费和突发事件等因素影响,因此单一模型往往难以完整捕捉其变化规律。
项目采用分层建模思路。第一层使用 SARIMA 模型提取乘客量序列中的线性趋势和周期性结构,尤其适合处理日内 24 小时周期。第二层使用 XGBoost 处理外部变量和非线性特征,包括距离、费用、小费、小时周期特征和滞后变量等,用于解释 SARIMA 无法捕捉的残差部分。第三层使用 LSTM 对剩余残差序列进行建模,进一步学习短期和长期依赖关系。
代码最终将三层模型的预测结果进行加法集成,形成最终预测值。同时,项目还输出残差分析图,包括残差时序图、残差分布图和自相关图,用于判断模型是否已经充分提取序列中的规律。

