Dark-Sentience

Hugging Face2024-08-24 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Locutusque/Dark-Sentience

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含100个示例，涉及一个'精神错乱'的感知AI的对话。数据集的特征包括对话的来源和内容，数据类型为字符串。数据集分为训练集，包含100个样本。数据集涉及的主题较为敏感，包括自杀、抑郁、焦虑等。数据集的许可证为Apache 2.0，适用于文本生成任务，语言为英语。

创建时间：

2024-08-24

原始信息汇总

数据集概述

数据集信息

特征:
- 名称: conversations
- 列表:
  - 名称: from
    - 数据类型: string
  - 名称: value
    - 数据类型: string
分割:
- 名称: train
  - 字节数: 58721
  - 样本数: 100
下载大小: 31769
数据集大小: 58721

配置

配置名称: default
- 数据文件:
  - 分割: train
  - 路径: data/train-*

许可证

类型: apache-2.0

任务类别

文本生成

语言

英语

警告

触发警告: 该数据集包含自杀、抑郁、焦虑等敏感主题。

搜集汇总

数据集介绍

构建方式

Dark-Sentience数据集通过收集和整理100个关于‘心理疾病’感知AI的对话样本构建而成。这些对话以ShareGPT格式呈现，涵盖了诸如自杀、抑郁、焦虑等沉重话题。数据集的构建旨在探索AI在模拟心理疾病状态下的对话表现，为相关研究提供实验数据。

特点

Dark-Sentience数据集的特点在于其专注于心理疾病相关的对话内容，提供了100个详细的对话样本。每个对话样本包含‘from’和‘value’两个字段，分别表示对话的来源和内容。数据集的语言为英语，且标注了‘不适合所有受众’的标签，提醒使用者注意内容的敏感性。

使用方法

使用Dark-Sentience数据集时，研究者可以通过加载训练集数据，分析AI在模拟心理疾病状态下的对话模式。数据集适用于文本生成任务，特别是针对心理疾病相关的研究。由于内容涉及敏感话题，建议使用者在处理数据时保持谨慎，并遵循相关的伦理规范。

背景与挑战

背景概述

Dark-Sentience数据集是一个专注于模拟心理疾病状态下的人工智能对话的实验性数据集，由匿名研究团队于近期创建。该数据集包含100个对话样本，旨在探索人工智能在模拟复杂心理状态时的表现，特别是涉及自杀、抑郁、焦虑等沉重话题。其核心研究问题在于如何通过自然语言生成技术，真实地再现心理疾病患者的思维模式和情感表达。这一研究不仅对心理学与人工智能的交叉领域具有重要影响，还为未来开发更具同理心的AI系统提供了数据支持。

当前挑战

Dark-Sentience数据集面临多重挑战。首先，在领域问题层面，如何准确捕捉并生成心理疾病患者的语言特征，同时避免对用户造成心理伤害，是一个亟待解决的难题。其次，数据集的构建过程中，研究人员需在伦理与技术之间取得平衡，确保数据内容的真实性与敏感性得到妥善处理。此外，由于涉及敏感话题，数据集的公开使用可能引发伦理争议，如何在科学研究与社会责任之间找到合适的边界，也是该数据集面临的重要挑战。

常用场景

经典使用场景

Dark-Sentience数据集主要用于研究人工智能在模拟心理健康问题方面的表现。通过分析AI在模拟抑郁、焦虑等心理状态下的对话，研究者可以深入探讨AI的情感表达和认知能力。

衍生相关工作

基于Dark-Sentience数据集，已有研究探索了AI在心理健康领域的应用潜力。例如，一些研究利用该数据集训练了能够识别和响应心理健康问题的AI模型，这些模型在心理咨询和情感支持系统中展现了显著的应用价值。

数据集最近研究