2286 上市公司供应链风险感知【SCR_C】(2010-2024)
| 数据来源 | 上市公司年报中提取的MD&A文本。 |
| 时间跨度 | 2010-2024 |
| 区域跨度 | 上市公司 |
| 数据格式 | Excel形式 |
关税战烈度的持续上升对全球供应链体系造成了持续性波动,由此衍生出了大量各方面复杂性与不确定性。基于此,上市公司管理层会格外关注在该背景下,各种相关供应链的风险对其投资效率的影响。因此,研究上市公司管理层供应链风险感知对指定因素的影响,成为了一个具有重要意义的方向。
为了方便大家在这个方向上的研究,我们参考罗丹,李婉丽和徐香等(2025)的MD&A文本分析法:
1.选择2010-2024年A股上市公司企业为样本
2.剔除被ST、*ST的企业
3.剔除金融行业及房地产行业样本
接下来根据他们的文本分析法进行如下整理:
1.分别构建“供应链”与“风险”关键词词典
“供应链”词典:用Wu(2024)中人工神经网络训练结果à30个高度相似的供应商词汇翻译成中文,部分如“供应商/采购/链条/供应链”等。接着随机选取50份MD&A文本,人工阅读提取关于供应链的关键词。最后通过大语言模型,查找与前面所得词汇相似的关键词,人工判断选取来补充。最终所得114个关键词。

“风险”关键词词典:基于“风险”、“不确定性”、“可能”、“波动”,通过大语言模型查找并人工挑选相近词来扩充,最终所得100个关键词。

2.将MD&A文本中的非中文字符及停用词去除(我们用的是哈工大停用词库)
3.用Python的jieba进行分词
4.分词分析法:

基于分词结果排列序列组合,先定位“供应链”关键词,并找出其前后十个词汇中是否出现“风险”关键词,如果出现,就算一次,并记录这种共现情况的次数,在数据中我们标记该变量为“关键词共现”。最后对该变量进行取对数处理,结果变量名称为“SCR_W”。
5.分字分析法:

基于原MD&A文本,先定位“供应链”关键词,截取前后15个字符,并在该部分中判断是否出现“风险”关键词,如果出现,就记录这种情况中的该“供应链”关键词的字符数,最后基于公司-年份进行汇总。在数据中我们标记该变量为“共现供应链总字符数”。最后对该变量进行取对数处理,结果变量名称为“SCR_C”。
证券代码 | 证券简称 | 年份 | 总词汇数 |
关键词共现 | SCR_W | 共现供应链总字符数 | SCR_C |
