five

somosnlp-hackathon-2023/DiagTrast

收藏
Hugging Face2023-04-09 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/somosnlp-hackathon-2023/DiagTrast
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过使用ChatGPT-4生成的,基于《精神障碍诊断与统计手册(DSM-5)》中描述的一些精神障碍的特征。数据集包含五个精神障碍的描述,每个描述包括症状、疾病名称、疾病类别编号以及清理后的症状文本。数据集主要用于文本分类任务,特别是精神障碍的分类。数据集的创建旨在帮助减少精神障碍的诊断时间,并增加能够被诊断和治疗的患者数量。

该数据集是通过使用ChatGPT-4生成的,基于《精神障碍诊断与统计手册(DSM-5)》中描述的一些精神障碍的特征。数据集包含五个精神障碍的描述,每个描述包括症状、疾病名称、疾病类别编号以及清理后的症状文本。数据集主要用于文本分类任务,特别是精神障碍的分类。数据集的创建旨在帮助减少精神障碍的诊断时间,并增加能够被诊断和治疗的患者数量。
提供机构:
somosnlp-hackathon-2023
原始信息汇总

数据集概述

数据集名称

  • 名称: DiagTrast

数据集特征

  • 特征:
    • Sintoma: 字符串类型,描述患者症状的段落。
    • Padecimiento: 字符串类型,根据DSM-5指示的疾病名称。
    • Padecimiento_cat: 整数类型,用于文本分类模型的标签。
    • Sintoma_limpia: 字符串类型,Sintoma字段的清洁文本。

数据集任务

  • 任务: 文本分类
  • 应用: 情感分析、自然语言推理、语法正确性评估

数据集语言

  • 语言: 西班牙语

数据集大小

  • 大小: 1K<n<10K

数据集许可

  • 许可: MIT

数据集标签

  • 标签: 心理、医疗、障碍

数据集内容

  • 内容: 包含描述心理障碍症状的声明,涉及的心理障碍包括自恋型人格障碍、戏剧型人格障碍、边缘型人格障碍、反社会型人格障碍和类精神分裂型人格障碍。

数据集结构

  • 实例结构: 每个实例包含症状描述、疾病名称、疾病序号和清洁文本。
  • 数据分割: 未分割,包含单一数据集,具体分布如下:
    • 自恋型人格障碍: 250条记录
    • 戏剧型人格障碍: 250条记录
    • 边缘型人格障碍: 358条记录
    • 反社会型人格障碍: 250条记录
    • 类精神分裂型人格障碍: 225条记录

数据集创建

  • 生成方式: 使用ChatGPT-4基于DSM-5描述的特征生成声明。
  • 数据验证: 确保声明不包含疾病名称,长度适中,且包含指定特征。

使用考虑

  • 社会影响: 有助于减少心理障碍诊断时间,增加患者治疗机会,但需谨慎使用以避免误导。
  • 偏差讨论: 数据为人工生成,可能与实际专业人士生成的输入不同,已通过验证和反馈优化数据生成过程。
  • 其他限制: 仅包含DSM-5中描述的5种障碍。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作