【C0153】基于 PDCH 数据集的抑郁问诊文本与语音情绪识别实验

图情学
自然语言处理 机器学习与深度学习 大语言模型
Python
时间图标 2026-05-22
高级

本项目基于 PDCH 中文抑郁问诊数据集,围绕抑郁问诊文本、语音情绪信息与 HAMD-17 抑郁量表评分识别展开复现实验。PDCH 数据集包含真实医患问诊场景下的中文问诊文本、原始音频、音频情绪标注以及专业人员填写的 HAMD-17 量表评分。本项目的核心目标,是比较纯文本输入、文本结合语音情绪标注输入,以及原始音频文本输入在 HAMD-17 因子评分任务中的与普通文本分类任务不同,本项目并不是简单判断患者是否抑郁,而是要求模型根据完整问诊内容,对 HAMD-17 中的 17 个症状因子进行结构化评分,包括抑郁情绪、有罪感、自杀、睡眠问题、工作兴趣、迟滞、激越、焦虑、躯体症状和自知力等。项目整体流程包括 HAMD 标签标准化处理、问诊 JSON 数据生成、模型推理、结构化结果解析和 17f1 指标评估。项目主要设计了三组实验。第一组为 Text-only,即仅使用医患问诊文本;第二组为 Text + Audio Emotion,即在问诊文本基础上加入语音情绪标注;第三组为 Audio-text,即尝试直接输入原始音频与文本进行多模态识别。实验结果显示,纯文本模型可以完成基础 HAMD-17 因子评分任务,但效果有限;当加入语音情绪标注后,模型识别效果明显提升,说明患者语音中的情绪信息能够为抑郁问诊识别提供有效补充。本项目的价值在于,它不仅复现了 PDCH 数据集上的抑郁问诊识别流程,还进一步比较了文本信息、语音情绪信息和原始音频输入在 HAMD-17 因子评分任务中的表现,为心理健康 AI 中“文本 + 语音情绪”融合建模提供了一个可复现的实验案例。参考文献如下:

1.Mossie, A., Kindu, D. & Negash, A. Prevalence and severity of depression and its association with substance use in jimma town, southwest ethiopia. Depression research and treatment 2016, 3460462 (2016).

2.Caiping, L. et al. Number and characteristics of medical professionals working in chinese mental health facilities. Shanghai Archives of Psychiatry 25, 277 (2013).

3.Hou, Z., Jiang, W., Yin, Y., Zhang, Z. & Yuan, Y. The current situation on major depressive disorder in china: research on mechanisms and clinical practice. Neuroscience bulletin 32, 389–397 (2016).

4.Organization, W. H. et al. Depression and other common mental disorders: global health estimates. (2017).等




下载代码
兑换码获取图标 兑换码获取
文件名称: C0153.zip
文件大小: 0.29MB
更新时间: 2026-05-22