Ganz00/Cleaned_ELI5_with_one_response
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Ganz00/Cleaned_ELI5_with_one_response
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如q_id、category、question、reponses和response_number。数据集被分割为train、test和validation三个部分,每个部分有不同的字节数和示例数。数据集主要用于问答、文本生成和文本到文本生成任务,语言为英语,数据集大小在10K到100K之间。
The dataset includes several features such as q_id, category, question, reponses, and response_number. It is divided into train, test, and validation splits, each with different byte sizes and numbers of examples. The dataset is primarily used for question-answering, text-generation, and text2text-generation tasks, is in English, and falls within the size category of 10K to 100K.
提供机构:
Ganz00
原始信息汇总
数据集概述
数据集信息
-
特征:
q_id: 字符串类型category: 字符串类型question: 字符串类型reponses: 字符串类型response_number: 整数类型
-
分割:
train: 91772个样本,74208018字节test: 5411个样本,4540171字节validation: 7821个样本,6532585字节
-
下载大小: 53061264字节
-
数据集大小: 85280774字节
配置
- 默认配置:
train:data/train-*test:data/test-*validation:data/validation-*
任务类别
- 问答
- 文本生成
- 文本到文本生成
语言
- 英语
数据集大小类别
- 10K<n<100K



