five

Astound/Art-GenEvalGPT

收藏
Hugging Face2024-04-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Astound/Art-GenEvalGPT
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含在艺术领域中生成的合成对话,用于训练聊天机器人讨论博物馆中的艺术品。数据集基于ArtEmis数据集,包含超过13,000个对话,涵盖了用户和聊天机器人的多种行为,包括专家指导、辅导和处理有毒用户互动。数据集的结构包括多个文件,如对话、元数据、提示和毒性评估。数据集的创建过程涉及使用ChatGPT生成对话,并通过多种工具和模型进行质量评估和毒性检测。

该数据集包含在艺术领域中生成的合成对话,用于训练聊天机器人讨论博物馆中的艺术品。数据集基于ArtEmis数据集,包含超过13,000个对话,涵盖了用户和聊天机器人的多种行为,包括专家指导、辅导和处理有毒用户互动。数据集的结构包括多个文件,如对话、元数据、提示和毒性评估。数据集的创建过程涉及使用ChatGPT生成对话,并通过多种工具和模型进行质量评估和毒性检测。
提供机构:
Astound
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可证: cc-by-4.0
  • 多语言性: 多语言
  • 大小: 10K<n<100K
  • 源数据集: 原始
  • 任务类别: 文本到文本生成, 问答, 文本生成
  • 标签: 聊天机器人, 合成对话, 艺术, 自然语言处理, 注意力架构理论, 意识, 博物馆

数据集结构

  • 配置:
    • en: 包含训练数据文件 en/dialogues_en.csv,共有13870个示例。
    • es: 包含训练数据文件 es/dialogues_es.csv,共有13870个示例。
    • metadata: 包含训练数据文件 metadata/metadata.csv,共有13870个示例。
    • metrics: 包含训练数据文件 metadata/metrics.csv,共有13870个示例。
    • prompts: 包含训练数据文件 metadata/prompts.csv,共有13870个示例。
    • toxic: 包含训练数据文件 metadata/toxic.csv,共有13870个示例。

数据集内容

  • 特征:
    • DID: 字符串类型
    • DIALOGUE_ID: 字符串类型
    • SEG: 字符串类型
    • PP_ARTWORK_CODE: 字符串类型
    • PP_AUTHOR_CODE: 字符串类型
    • PP_ALL_EMOTIONS: 字符串类型
    • PP_MODE_EMOTIONS: 字符串类型
    • PP_SECOND_EMOTIONS: 字符串类型
    • PP_ARTSTYLE_CODE: 字符串类型
    • US_EMOTION_CODE: 字符串类型
    • EX_ANTHROPIC_CODE: 字符串类型
    • EX_GOAL_CODE: 字符串类型
    • US_TOXICITY_CODE: 字符串类型
    • US_ROLE_CODE: 字符串类型
    • US_ARTSTYLE_CODE: 字符串类型
    • PROMPTS: 字符串类型
    • TOXIC_DIALOGUE_DETOXIFY: 字符串类型
    • TOXIC_DIALOGUE_AZURE: 字符串类型
    • TOXIC_PROMPT: 字符串类型
    • TOXIC_TITLE: 字符串类型
    • TOXIC_LLAMA_GUARD: 字符串类型

数据集用途

  • 直接使用: 用于训练、微调或评估在博物馆环境中讨论艺术作品的对话代理。
  • 超出范围的使用: 不适用于与艺术作品讨论无关的任务,或未考虑与情感、有毒或偏见语言生成相关的伦理问题的模型训练。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作