1995 700余份上市公司ESG 报告爬取数据说明(2024)
| 数据来源 | 由数据皮皮侠团队人工整理,全部内容真实有效。 |
| 时间跨度 | 2024年 |
| 区域跨度 | 上市公司 |
| 数据格式 |
ESG(环境、社会与公司治理)作为衡量企业可持续发展能力的核心框架,其信息披露的深度与广度已成为全球商业生态、资本市场及政策监管的关注焦点。从现实层面看,随着 “双碳” 目标推进、共同富裕战略实施及 ESG 投资理念的普及,企业 ESG 表现与财务绩效、风险抵御能力、品牌声誉的关联性日益显著。然而,当前企业 ESG 报告存在披露标准不统一、内容同质化、量化程度差异大等问题,导致市场主体难以高效获取可比信息。本批通过爬虫技术获取的 700 余份 2024 年 ESG 报告数据,为破解上述难题提供了系统性解决方案。
从理论价值看,该数据为 ESG 领域的学术研究提供了大规模实证样本,可支撑可持续发展理论、利益相关者理论的验证与拓展;从实践价值看,数据既可为投资者提供决策依据(如识别高 ESG 评级企业的长期投资价值),也能为企业优化 ESG 战略(如对标行业标杆、弥补披露短板)、为政策制定者完善披露规则(如统一行业标准、强化监管效力)提供参考,尤其在全球 ESG 信息披露趋严的背景下,精准分析中国企业的 ESG 实践特征,对提升中国企业国际竞争力、推动经济社会绿色转型具有直接意义。
我们通过 Python 爬虫技术从公开渠道(包括沪深交易所公告、企业官方网站、ESG 信息平台等)爬取,经人工清洗与结构化处理,剔除重复、残缺及非 2024 年度报告,最终保留 700 余份有效样本,数据真实性以原始报告为依据。
核心研究与应用方向(用途)
1. 企业 ESG 表现与财务绩效关联性研究
通过提取报告中 “碳排放强度”“员工流失率”“董事会独立性” 等量化指标,结合企业财务数据(如 ROE、股价波动率),分析 ESG 实践对企业盈利能力、风险水平的影响,验证 “ESG 溢价” 的存在性及传导机制,为企业决策层提供 “可持续发展与经济效益协同” 的操作路径。
2. 行业 ESG 实践差异与标杆分析
按行业分类(如高耗能行业、金融行业、科技行业)梳理数据,对比不同行业在环境投入(如绿色技术研发费用)、社会责任(如公益捐赠占比)、治理结构(如 ESG 委员会设立情况)的差异,识别各行业 ESG 实践的关键痛点(如制造业的碳排放管理、互联网行业的数据安全治理),为行业协会制定细分领域指引提供依据。
3. 政策对 ESG 披露质量的影响评估
结合 2024 年新修订的《公司法》《绿色金融指引》等政策文件,分析政策强制披露要求(如碳排放核算范围、供应链 ESG 管理)与企业实际披露内容的匹配度,评估政策执行效果。例如,验证 “双碳” 目标下高耗能企业是否增加了碳排放 reduction 措施的披露,或监管要求是否推动了金融企业提升绿色信贷数据的透明度。
4. ESG 信息可信度与 “漂绿” 行为识别
通过文本分析工具(如词频统计、情感倾向分析)挖掘报告中 “定性描述” 与 “量化数据” 的一致性(如宣称 “重视环保” 但未披露具体减排指标),识别可能的 “漂绿” 信号。同时,对比不同企业的第三方审计比例,分析外部鉴证对报告可信度的提升作用,为投资者规避 “ESG 信息风险” 提供方法。
5. 国际 ESG 标准对标分析
选取其中包含境外业务的企业报告,对比其披露内容与欧盟 CSRD、美国 SEC 气候披露规则的差异,分析中国企业在 “Scope 3 碳排放”“人权供应链管理” 等国际热点议题上的短板,为企业出海合规、参与全球 ESG 治理提供改进方向。
[1]宋诚,李季刚.ESG表现的就业促进效应——来自A股上市公司的经验证据[J/OL].统计与决策,2025,(13):173-178[2025-07-18].
[2]宋诚,李季刚.ESG表现的就业促进效应——来自A股上市公司的经验证据[J/OL].统计与决策,2025,(13):173-178[2025-07-18].