
【C0021】LASSO回归(sklearn)
经济学
管理科学
机器学习与深度学习
Python
LASSO 回归简介
LASSO (Least Absolute Shrinkage and Selection Operator) 回归是一种线性回归分析技术,它在损失函数中加入了 L1 正则化项。与普通最小二乘法不同,LASSO 能够将某些特征的系数压缩至恰好为零,从而实现特征选择的功能。
核心原理
- 损失函数: $Loss = RSS + \alpha \sum |\beta_j|$
- $RSS$: 残差平方和
- $\alpha$: 正则化参数,控制惩罚力度
- $\beta_j$: 第 j 个特征的系数
- 作用:
- 防止过拟合,提高模型泛化能力。
- 自动筛选重要特征,生成稀疏模型,增强可解释性。
本例说明
本代码使用 scikit-learn 库中的 Lasso 类,基于生成的模拟高维数据进行训练。通过设置 alpha=0.1,观察模型如何压缩不重要特征的系数,并评估其在测试集上的表现。