five

Instinct-AI/Xerxes-Instruct-700K

收藏
Hugging Face2024-04-01 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Instinct-AI/Xerxes-Instruct-700K
下载链接
链接失效反馈
官方服务:
资源简介:
Xerxes数据集以波斯国王Xerxes命名,因其智慧和战略才能而闻名,是四个不同数据集的集合。该数据集旨在满足自然语言处理任务日益增长的需求,特别是在对话建模和理解领域。数据集包含从生成模型到真实世界互动的各种对话来源。每个对话都标注了参与者的角色,提供了对话动态的深入洞察。数据集包括GPT4、Starling、MetaMath和WizardLM Instruct四个子数据集,涵盖了广泛的对话主题和风格。

Xerxes数据集以波斯国王Xerxes命名,因其智慧和战略才能而闻名,是四个不同数据集的集合。该数据集旨在满足自然语言处理任务日益增长的需求,特别是在对话建模和理解领域。数据集包含从生成模型到真实世界互动的各种对话来源。每个对话都标注了参与者的角色,提供了对话动态的深入洞察。数据集包括GPT4、Starling、MetaMath和WizardLM Instruct四个子数据集,涵盖了广泛的对话主题和风格。
提供机构:
Instinct-AI
原始信息汇总

数据集卡片 "Xerxes-Instruct-700K"

描述

Xerxes 数据集是由四个不同的数据集合并而成的,旨在满足自然语言处理任务,特别是对话建模和理解的需求。该数据集包含从生成模型到现实世界交互的各种来源的对话,每个对话都标注了参与者的角色,提供了对话动态的洞察。

概览

  • GPT4 数据集: 由 GPT4 模型生成的对话,展示了其语言生成能力。
  • Starling 数据集: 来自 Starling 数据集的多样化对话数据,反映了广泛的主题和对话风格。
  • MetaMath 数据集: 从 MetaMath 数据集中提取的关于数学主题的讨论,提供了专业对话的视角。
  • WizardLM Instruct 数据集: 包含教学内容的对话,来自 WizardLM Instruct 数据集,丰富了数据集的教育性讨论。

配置

  • 配置名称: default
  • 数据文件:
    • 分割: train
      • 路径: data/train-*
  • 数据集信息:
    • 特征:
      • 对话:
        • 内容: 对话的文本内容。
        • 角色: 对话中每个参与者的角色。
    • 分割:
      • 名称: train
      • 字节数: 777,727,528
      • 示例数: 702,522
    • 下载大小: 402,767,851 字节
    • 数据集大小: 777,727,528 字节

许可证

Xerxes 数据集继承了其组成数据集的许可证。请参考每个单独数据集的许可证以获取更多信息。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作