
【C0004】《软科学》双重机器学习论文复现代码:人工智能政策对企业新质生产力的因果推断研究
经济学
会计金融
管理科学
数据整理与描述分析
计量经济学与因果推断
机器学习与深度学习
Python
数据包含:
股票代码
年份
新质生产力指标(NP)
政策虚拟变量(AI)
各类控制变量
2. 数据清洗
代码会自动执行多步数据清洗,包括:
剔除 ST / *ST 企业
剔除已退市企业
剔除成立未满一年的企业
筛选制造业企业
对关键变量进行上下 1% 缩尾处理
3. 模型设定
构建四种不同的模型规格:
直接效应(仅控制变量)
时间固定效应
个体固定效应
双向固定效应
4. 模型估计
使用
LinearDML模型结果变量模型采用随机森林回归器
处理变量模型采用随机森林分类器
进行 2 折交叉拟合以避免过拟合
结果输出
程序会输出包含以下内容的结果表格:
平均处理效应(ATE)
标准误
显著性水平
样本量
支持政策效应的统计推断。
关键特性
自动处理面板数据结构,避免样本交叉污染
支持多种固定效应组合,增强估计的稳健性
提供完整的统计推断结果(p 值、置信区间等)
复现文献中的实证研究设计,结果具有可比性
使用者只需准备好符合格式要求的数据文件,运行代码即可得到人工智能政策对制造企业新质生产力的因果效应估计,为政策评估提供严谨的计量经济学证据。
参考文献
徐红丹, 王玖河. 人工智能与制造企业新质生产力——基于双重机器学习模型[J]. 软科学, 2025, 39(05):26-33.