five

golden_seeds_ev_depression

收藏
Hugging Face2025-06-11 更新2025-06-12 收录
下载链接:
https://huggingface.co/datasets/Plum551/golden_seeds_ev_depression
下载链接
链接失效反馈
官方服务:
资源简介:
Golden Seeds EV Depression Dataset是一个创新的数据集,它系统地将人类同情心编码为结构化的AI输入,用于抑郁评估。这个经过特殊教育教师手工标注的数据集,将同情心洞察转化为可算法操作的同情心向量,以增强而非替代人类的判断。
创建时间:
2025-06-09
搜集汇总
数据集介绍
main_image_url
构建方式
在心理健康与特殊教育交叉领域,Golden Seeds EV Depression数据集通过系统化方法构建而成。数据源自Reddit的r/depression子论坛公开文本,经严格匿名化处理确保隐私安全。由特殊教育专家手工标注,采用半辅助工作流程:专家基于PHQ-9症状维度对每篇抑郁叙事进行九维共情向量评分,并撰写详细判断依据,生成式AI仅辅助语言组织,所有评分决策均保留人类专业判断。
特点
该数据集开创性地将人类共情结构化编码为算法可处理的九维向量,每个维度对应PHQ-9核心症状并采用0-5分标度。包含200个专家精标案例,涵盖从无抑郁到高自杀风险的七级严重程度分类。其标注质量经严格验证,EV-PHQ9一致性达到κ=0.705,准确率达75.5%,体现了特殊教育领域专业认知与算法需求的高度融合。
使用方法
数据集支持多种心理健康计算研究场景:可作为训练样本驱动全自动标注管道,使AI模型学习共情向量推断模式;为共情感知的抑郁评估模型提供基准测试框架;促进人类专家与AI的协同决策研究。使用时需遵循CC BY-NC 4.0许可,严格限于研究用途,禁止临床诊断应用,且必须保持人类专业监督机制。
背景与挑战
背景概述
Golden Seeds EV Depression数据集由纽约大学坦登工程学院的Boning Zhao于2025年创建,旨在通过结构化编码人类共情来革新心理健康评估领域。该数据集聚焦于特殊教育场景中的抑郁评估问题,首次将教育工作者的隐性共情洞察转化为九维共情向量,为AI辅助决策提供可解释的输入框架。其创新性体现在将PHQ-9临床标准与教育专家的领域知识相融合,通过200个经专家标注的抑郁叙事样本,构建了连接人类主观判断与算法客观分析的新型桥梁,对促进心理健康领域的可信AI发展具有里程碑意义。
当前挑战
该数据集核心挑战在于解决抑郁评估中主观经验与客观量化之间的认知鸿沟,需将模糊的共情感知转化为可计算的九维向量。构建过程中面临双重困难:一是确保特殊教育专家标注的一致性,需通过半辅助工作流平衡人工精度与效率;二是维持临床有效性,需使共情向量与PHQ-9症状维度精确对齐并获得0.705的科恩卡帕系数验证。数据来源仅限于公开匿名文本,需规避个人信息残留风险,且样本规模受限难以覆盖抑郁表现的全部异质性。
常用场景
经典使用场景
在心理健康计算领域,Golden Seeds EV Depression数据集被广泛应用于基于文本的抑郁严重程度分类任务。该数据集通过特殊教育专家标注的九维共情向量,为机器学习模型提供了结构化的人类共情认知模式。研究者利用这些精细标注的向量训练分类器,能够准确识别从无抑郁到高自杀风险严重抑郁的七个等级,为自动化心理评估奠定了数据基础。
解决学术问题
该数据集创新性地解决了传统抑郁评估中主观性与客观性难以统一的问题。通过将人类共情认知转化为算法可处理的向量表示,建立了可解释的人工智能决策框架。其PHQ-9对齐的维度设计确保了临床有效性,而专家标注的理性说明则为模型可解释性研究提供了宝贵资源,推动了心理健康领域人机协作范式的理论发展。
衍生相关工作
基于该数据集衍生的经典研究包括共情向量嵌入模型开发、可解释抑郁分类算法设计以及人机协同标注系统构建。这些工作深入探索了结构化共情表征在自然语言处理中的有效性,创建了新型的半自动数据标注管道,并为心理健康领域的算法透明度研究设立了新标准,推动了情感计算与临床心理学的跨学科融合。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作