D$^4$

arXiv2022-10-24 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2205.11764v2

下载链接

链接失效反馈

官方服务：

资源简介：

D$^4$是一个面向抑郁症诊断的中文对话数据集，模拟了医生和患者在抑郁症诊断过程中的对话，包括由专业精神科医生提供的诊断结果和症状总结。

D$^4$ is a Chinese dialogue dataset for depression diagnosis. It simulates the conversations between doctors and patients during the depression diagnosis process, and includes diagnostic results and symptom summaries provided by professional psychiatrists.

创建时间：

2022-05-24

搜集汇总

数据集介绍

构建方式

在精神健康领域，临床抑郁症诊断对话数据的稀缺性构成了研究的重要障碍。为构建贴近临床实践的诊断导向对话数据集，研究团队设计了一套严谨的三阶段数据构建流程。第一阶段通过基于状态机的咨询聊天机器人收集自然人群的抑郁症状画像，这些画像严格遵循国际临床诊断标准ICD-11和DSM-5。第二阶段组织经过专业培训的众包工作者，分别扮演医生和患者角色，依据第一阶段收集的画像进行诊断对话模拟，并要求医生角色在对话过程中标注话题转换。第三阶段邀请执业精神科医生和心理治疗师对模拟对话进行临床符合性审核，筛选合格对话并提供专业的诊断摘要与症状总结，最终构建了包含1339个高质量对话的D4数据集。

特点

该数据集呈现出多维度复合特征，其对话平均轮次达21.6轮，显著长于常规任务型对话，体现了抑郁症诊断过程所需的深度探索特性。数据集涵盖10类诊断话题标签与13类核心症状标签，其中共情话题占比高达23.1%，凸显了情感支持在临床诊断中的关键地位。话题转移分析显示诊断过程遵循从核心症状到行为症状的渐进深入模式，与临床实践高度吻合。症状摘要的标注体系基于ICD-11标准构建，能够清晰反映不同严重程度患者的症状分布差异，为模型训练提供了细粒度的监督信号。

使用方法

该数据集支持抑郁症诊断全流程的四大任务建模。在响应生成任务中，模型需根据对话历史生成医生的后续回应，可结合话题预测任务进行联合优化以提升生成准确性。话题预测任务要求模型识别医生回应的诊断话题类别，其中共情话题的准确预测是提升对话体验的关键。对话摘要任务需要模型从完整对话历史中提取核心症状信息生成结构化摘要，这些摘要可作为分类任务的重要输入。严重程度分类任务包含抑郁发作与自杀风险的双重评估，支持基于对话历史或症状摘要的二元与四级分类，其中症状摘要能显著提升分类性能，体现了诊断摘要的临床价值。

背景与挑战

背景概述

D4数据集由上海交通大学X-LANCE实验室联合上海精神卫生中心于2022年构建，旨在填补面向抑郁症诊断的对话系统研究领域的数据空白。该数据集基于国际临床诊断标准ICD-11与DSM-5，通过模拟真实医患诊断对话，构建了包含1339段对话的语料库，并附有专业精神科医生提供的诊断摘要与严重程度评估。其核心研究问题在于如何构建一个兼具任务导向与情感支持的复合型对话系统，以提升抑郁症筛查的准确性与用户体验，对推动心理健康领域的人机交互研究具有开创性意义。

当前挑战

该数据集致力于解决抑郁症诊断对话系统构建中的核心挑战：如何在对话中平衡症状信息收集与情感支持提供，实现临床诊断准确性与对话自然度的统一。在数据构建过程中，面临多重挑战：首先，由于心理健康数据的敏感性与隐私保护要求，难以获取真实临床对话记录，需通过模拟对话与专业监督相结合的方式构建数据；其次，抑郁症诊断涉及多维症状与主观表达，要求对话模拟者深入理解症状内涵并进行自然语言演绎，对参与者培训与质量控制提出极高要求；此外，对话需同时标注话题、症状、诊断结果等多层次信息，增加了数据标注的复杂度与一致性难度。

常用场景

经典使用场景

在精神健康计算语言学领域，D⁴数据集为构建面向抑郁症诊断的对话系统提供了核心训练资源。该数据集模拟了临床实践中精神科医生与患者之间的结构化访谈，其对话流程严格遵循国际疾病分类（ICD-11）和精神障碍诊断与统计手册（DSM-5）的诊断标准。研究人员利用该数据集训练模型，以生成兼具共情支持与症状采集功能的对话响应，从而在虚拟咨询场景中实现贴近真实医疗流程的交互体验。

解决学术问题

D⁴数据集有效应对了心理健康领域对话数据稀缺的挑战，为计算精神病学研究提供了关键基础设施。它支持四大核心任务：对话响应生成、话题预测、对话摘要以及抑郁发作与自杀风险的严重程度分类。这些任务共同模拟了临床诊断的全过程，使得基于数据驱动的对话系统能够超越传统量表式评估，实现个性化、动态化的症状探查与情感支持，从而弥合了自动化诊断工具与面对面临床访谈之间的体验鸿沟。

衍生相关工作

围绕D⁴数据集，学术界已衍生出多项探索性研究，主要集中在诊断导向对话系统的架构优化与评估方法创新。例如，研究者利用该数据训练如BART、CPT等预训练语言模型，显著提升了对话生成在共情表达与诊断逻辑上的准确性。同时，相关工作深入分析了话题转移模式与共情词汇的语义特征，为理解诊断对话的动态结构提供了理论依据。这些研究共同推动了任务导向聊天这一新型对话范式的技术进步与标准建立。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集