stallone/Open-Platypus
收藏Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/stallone/Open-Platypus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三种配置:completion、conversation和source。每种配置都有不同的特征,如输入、输出、文档ID、消息内容、角色、指令和数据源。数据集主要用于训练,每种配置的训练集大小和示例数量均已提供。
The dataset includes three configurations: completion, conversation, and source. Each configuration has different features such as input, output, document ID, message content, role, instruction, and data source. The dataset is primarily used for training, with the size of the training set and the number of examples provided for each configuration.
提供机构:
stallone
原始信息汇总
数据集概述
数据集配置
配置名称:completion
- 特征:
input:类型为字符串output:类型为字符串doc_id:类型为字符串
- 分割:
train:包含14577个样本,占用15364115字节
- 下载大小:7958022字节
- 数据集大小:15364115字节
配置名称:conversation
- 特征:
doc_id:类型为字符串messages:列表类型,包含以下子特征:content:类型为字符串role:类型为字符串
- 分割:
train:包含14577个样本,占用15728540字节
- 下载大小:7795962字节
- 数据集大小:15728540字节
配置名称:source
- 特征:
input:类型为字符串output:类型为字符串instruction:类型为字符串data_source:类型为字符串doc_id:类型为字符串
- 分割:
train:包含24926个样本,占用31773492字节
- 下载大小:16514465字节
- 数据集大小:31773492字节
数据文件路径
配置名称:completion
- 训练数据文件路径:
completion/train-*
配置名称:conversation
- 训练数据文件路径:
conversation/train-*
配置名称:source
- 训练数据文件路径:
source/train-*



