Instinct-AI/Xerxes-Instruct-700K
收藏Hugging Face2024-04-01 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Instinct-AI/Xerxes-Instruct-700K
下载链接
链接失效反馈官方服务:
资源简介:
Xerxes数据集以波斯国王Xerxes命名,因其智慧和战略才能而闻名,是四个不同数据集的集合。该数据集旨在满足自然语言处理任务日益增长的需求,特别是在对话建模和理解领域。数据集包含从生成模型到真实世界互动的各种对话来源。每个对话都标注了参与者的角色,提供了对话动态的深入洞察。数据集包括GPT4、Starling、MetaMath和WizardLM Instruct四个子数据集,涵盖了广泛的对话主题和风格。
Xerxes数据集以波斯国王Xerxes命名,因其智慧和战略才能而闻名,是四个不同数据集的集合。该数据集旨在满足自然语言处理任务日益增长的需求,特别是在对话建模和理解领域。数据集包含从生成模型到真实世界互动的各种对话来源。每个对话都标注了参与者的角色,提供了对话动态的深入洞察。数据集包括GPT4、Starling、MetaMath和WizardLM Instruct四个子数据集,涵盖了广泛的对话主题和风格。
提供机构:
Instinct-AI
原始信息汇总
数据集卡片 "Xerxes-Instruct-700K"
描述
Xerxes 数据集是由四个不同的数据集合并而成的,旨在满足自然语言处理任务,特别是对话建模和理解的需求。该数据集包含从生成模型到现实世界交互的各种来源的对话,每个对话都标注了参与者的角色,提供了对话动态的洞察。
概览
- GPT4 数据集: 由 GPT4 模型生成的对话,展示了其语言生成能力。
- Starling 数据集: 来自 Starling 数据集的多样化对话数据,反映了广泛的主题和对话风格。
- MetaMath 数据集: 从 MetaMath 数据集中提取的关于数学主题的讨论,提供了专业对话的视角。
- WizardLM Instruct 数据集: 包含教学内容的对话,来自 WizardLM Instruct 数据集,丰富了数据集的教育性讨论。
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 分割: train
- 数据集信息:
- 特征:
- 对话:
- 内容: 对话的文本内容。
- 角色: 对话中每个参与者的角色。
- 对话:
- 分割:
- 名称: train
- 字节数: 777,727,528
- 示例数: 702,522
- 下载大小: 402,767,851 字节
- 数据集大小: 777,727,528 字节
- 特征:
许可证
Xerxes 数据集继承了其组成数据集的许可证。请参考每个单独数据集的许可证以获取更多信息。



