somosnlp-hackathon-2023/DiagTrast
收藏Hugging Face2023-04-09 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/somosnlp-hackathon-2023/DiagTrast
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过使用ChatGPT-4生成的,基于《精神障碍诊断与统计手册(DSM-5)》中描述的一些精神障碍的特征。数据集包含五个精神障碍的描述,每个描述包括症状、疾病名称、疾病类别编号以及清理后的症状文本。数据集主要用于文本分类任务,特别是精神障碍的分类。数据集的创建旨在帮助减少精神障碍的诊断时间,并增加能够被诊断和治疗的患者数量。
该数据集是通过使用ChatGPT-4生成的,基于《精神障碍诊断与统计手册(DSM-5)》中描述的一些精神障碍的特征。数据集包含五个精神障碍的描述,每个描述包括症状、疾病名称、疾病类别编号以及清理后的症状文本。数据集主要用于文本分类任务,特别是精神障碍的分类。数据集的创建旨在帮助减少精神障碍的诊断时间,并增加能够被诊断和治疗的患者数量。
提供机构:
somosnlp-hackathon-2023
原始信息汇总
数据集概述
数据集名称
- 名称: DiagTrast
数据集特征
- 特征:
Sintoma: 字符串类型,描述患者症状的段落。Padecimiento: 字符串类型,根据DSM-5指示的疾病名称。Padecimiento_cat: 整数类型,用于文本分类模型的标签。Sintoma_limpia: 字符串类型,Sintoma字段的清洁文本。
数据集任务
- 任务: 文本分类
- 应用: 情感分析、自然语言推理、语法正确性评估
数据集语言
- 语言: 西班牙语
数据集大小
- 大小: 1K<n<10K
数据集许可
- 许可: MIT
数据集标签
- 标签: 心理、医疗、障碍
数据集内容
- 内容: 包含描述心理障碍症状的声明,涉及的心理障碍包括自恋型人格障碍、戏剧型人格障碍、边缘型人格障碍、反社会型人格障碍和类精神分裂型人格障碍。
数据集结构
- 实例结构: 每个实例包含症状描述、疾病名称、疾病序号和清洁文本。
- 数据分割: 未分割,包含单一数据集,具体分布如下:
- 自恋型人格障碍: 250条记录
- 戏剧型人格障碍: 250条记录
- 边缘型人格障碍: 358条记录
- 反社会型人格障碍: 250条记录
- 类精神分裂型人格障碍: 225条记录
数据集创建
- 生成方式: 使用ChatGPT-4基于DSM-5描述的特征生成声明。
- 数据验证: 确保声明不包含疾病名称,长度适中,且包含指定特征。
使用考虑
- 社会影响: 有助于减少心理障碍诊断时间,增加患者治疗机会,但需谨慎使用以避免误导。
- 偏差讨论: 数据为人工生成,可能与实际专业人士生成的输入不同,已通过验证和反馈优化数据生成过程。
- 其他限制: 仅包含DSM-5中描述的5种障碍。



