stallone/goat

Name: stallone/goat
Creator: stallone
Published: 2024-07-03 23:49:45
License: 暂无描述

Hugging Face2024-07-03 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/stallone/goat

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个不同的配置：completion、conversation和source。每个配置都有不同的特征，如输入、输出、文档ID等。数据集主要用于训练目的，包含大量的训练样本。具体用途可能涉及文本生成、对话系统等NLP任务。

The dataset includes three different configurations: completion, conversation, and source. Each configuration has different features such as input, output, document ID, etc. The dataset is primarily used for training purposes and contains a large number of training samples. Potential applications may include text generation, dialogue systems, and other NLP tasks.

提供机构：

stallone

原始信息汇总

数据集概述

数据集配置

配置名称：completion

特征：
- output：类型为字符串
- input：类型为字符串
- doc_id：类型为字符串
分割：
- train：
  - 字节数：337,425,389
  - 样本数：1,746,300
下载大小：220,153,671 字节
数据集大小：337,425,389 字节
数据文件路径：
- train：completion/train-*

配置名称：conversation

特征：
- doc_id：类型为字符串
- messages：列表类型，包含以下字段：
  - content：类型为字符串
  - role：类型为字符串
分割：
- train：
  - 字节数：381,082,889
  - 样本数：1,746,300
下载大小：211,035,276 字节
数据集大小：381,082,889 字节
数据文件路径：
- train：conversation/train-*

配置名称：source

特征：
- instruction：类型为字符串
- output：类型为字符串
- answer：类型为字符串
- input：类型为字符串
- doc_id：类型为字符串
分割：
- train：
  - 字节数：398,181,779
  - 样本数：1,746,300
下载大小：272,506,374 字节
数据集大小：398,181,779 字节
数据文件路径：
- train：source/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集