1936 政策关联程度指标(1992-2024)

关键字:政策关联程度指标(1992-2024) 发布时间:2025-05-26 查看更多详细信息
数据来源 原始数据来源于A股上市公司年报文本及政府工作报告文本,由数据皮皮侠团队人工整理,全部内容真实有效。
时间跨度 1992年-2024年
区域跨度 A股上市公司
数据格式 数据格式为Excel形式
数据简介

企业政策相似度是通过自然语言处理技术量化企业年报与政府工作报告文本关联程度的重要指标,其数据价值体现在多维度政策效果评估与微观企业行为分析的创新结合。该数据集采用Word2Vec词向量模型和余弦相似度算法,将非结构化文本转化为可度量的结构化指标,突破了传统政策量化方法的局限,为追踪企业对产业政策的响应灵敏度提供了动态视角。研究发现,政策相似度不仅能够有效识别受政策激励的民营企业、中小企业和东部地区企业群体,还揭示了政策传导的双重机制:一方面通过降低融资约束和增加政府补贴直接提升短期业绩,另一方面推动企业基于政策导向优化长期战略布局。这一数据集为评估政策执行效率、识别政策敏感行业、优化资源配置提供了实证基础,同时为政府动态调整政策工具、企业制定合规发展战略提供了数据驱动的决策依据,具有重要的学术创新价值和实践应用潜力。因此本数据参考覃飞,沈艳(2021)的做法,构建电子商务进农村综合示范县的数据集。

首先,对政府工作报告和企业年报进行分词处理,使用正则表达式过滤非中文字符并去除常见停用词;接着通过智能文件名解析器提取企业代码、名称及年份信息;构建包含政府文本(重复3次强化语义)和企业文本的混合语料库,训练300Word2Vec词向量模型;采用词向量均值法生成文本表征,计算企业年报与同年政府报告的余弦相似度;最后对全量相似度结果进行min-max标准化处理,将原始值映射到[0,1]区间,最终输出包含标准化后的标准化的政策相似度、企业代码、企业简称及年份的排序结果,其中相似度越接近1表示政策导向一致性越高,越接近0则差异越大。该标准化处理使得不同年份、不同企业间的相似度具有可比性,为后续政策影响分析提供标准化度量基准。


数据指标

股票代码

公司简称

报告年份年份

标准化政策相似度


数据展示

image.png

参考文献

[1]覃飞,沈艳.产业政策关联度对公司业绩影响研究[J].数量经济技术经济研究,2021,38(09):117-138.