2300 上市公司企业创新质量(2000-2025)
| 数据来源 | 由数据皮皮侠团队搜集整理,所有数据真实有效 |
| 时间跨度 | 2000-2025 |
| 区域跨度 | Excel形式 |
| 数据格式 |
企业创新质量(innov_qual)是衡量企业技术创新深度与技术知识复杂性的核心指标。本数据集基于中国A股上市公司发明专利数据构建,时间跨度为1988—2025年,涵盖共计1048575条公司-专利观察值。核心指标包括:股票代码、公司简称、申请年份、企业创新质量(innov_qual)。该指标参考Aghion et al.(2019)及张杰和郑文平(2018)的研究思路,采用专利知识宽度法进行测度。专利知识宽度反映了专利所涉及技术知识的广泛性与复杂性,知识宽度越大,专利越难以被模仿或改进,创新质量越高。具体而言,首先基于专利的IPC分类号提取大组层级信息,计算每件发明专利的知识宽度;随后,按企业—年份维度取知识宽度的中位数,作为企业在该年度的创新质量。该指标能够有效刻画企业在特定年份内发明专利的技术多样性水平,避免因专利数量分布不均带来的偏误。
基于本数据集,研究者可从开展三方面系统分析。一是政府补贴与企业创新质量的非线性关系研究。将创新质量指标与政府补贴强度、营商环境指数等变量匹配,采用面板门槛模型检验补贴效应在不同营商环境水平下的差异化表现,验证补贴政策是否存在“条件有效性”。二是创新质量对企业成长韧性的影响机制研究。利用创新质量指标与企业全要素生产率、销售收入波动性等韧性指标进行关联分析,探究高质量创新是否能够增强企业在不确定性环境中的抗风险能力与恢复能力。三是创新质量的异质性分析。结合企业产权性质(国有与非国有)、行业属性(战略性新兴产业与非战略性新兴产业)以及地区制度环境(政府廉洁度、产权保护度等)进行分组检验,揭示创新质量在不同情境下的驱动因素与作用边界,为政策制定提供差异化依据。
本数据集的指标构建严格遵循专利知识宽度的测度方法。首先,从原始专利数据中提取公开号、IPC分类号、申请年份、公司名称、股票代码等字段,并根据公开号后缀筛选发明专利(以“A”结尾),剔除实用新型专利(以“U”结尾)。其次,针对每件发明专利的IPC分类号字符串(格式如“H10F71/00; C25D7/12; H10F77/20”),按分号拆分为多个IPC分类号,并提取每个分类号的大组信息(将分类号统一转换为“/00”结尾,如“H10F71/00”),形成该专利的大组列表。再次,根据赫芬达尔—赫希曼指数的测算思路,计算每件专利的知识宽度:统计每个大组在该专利中出现的次数,计算其占比平方和
,专利知识宽度定义为
。该值越大,表示专利所涉及的技术大组越分散、知识覆盖越广泛。最后,按股票代码与申请年份分组,取各组内所有发明专利知识宽度的中位数,作为该企业在该年度的创新质量(innov_qual)。对于某年无发明专利的企业,该年度不纳入最终样本。所有处理均通过Python编程实现,确保数据清洗、计算与汇总过程的可复现性。
股票代码 | 公司简称 | 申请年份 | Innov_qual |

[1] Aghion P, Akcigit U, Bergeaud A, et al. Innovation and Top Income Inequality[J]. Review of Economic Studies, 2019, 86(1): 1-45.
[2] 张杰, 郑文平. 创新追赶战略抑制了中国专利质量么?[J]. 经济研究, 2018, 53(5): 28-41.
[3] 叶初升, 张清, 马凯榕. 突破“创新悖论”:政府补贴何以有效促进企业创新[J]. 中国工业经济, 2025, (10): 40-58.