five

Ganz00/Cleaned_ELI5_with_one_response

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Ganz00/Cleaned_ELI5_with_one_response
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如q_id、category、question、reponses和response_number。数据集被分割为train、test和validation三个部分,每个部分有不同的字节数和示例数。数据集主要用于问答、文本生成和文本到文本生成任务,语言为英语,数据集大小在10K到100K之间。

The dataset includes several features such as q_id, category, question, reponses, and response_number. It is divided into train, test, and validation splits, each with different byte sizes and numbers of examples. The dataset is primarily used for question-answering, text-generation, and text2text-generation tasks, is in English, and falls within the size category of 10K to 100K.
提供机构:
Ganz00
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • q_id: 字符串类型
    • category: 字符串类型
    • question: 字符串类型
    • reponses: 字符串类型
    • response_number: 整数类型
  • 分割:

    • train: 91772个样本,74208018字节
    • test: 5411个样本,4540171字节
    • validation: 7821个样本,6532585字节
  • 下载大小: 53061264字节

  • 数据集大小: 85280774字节

配置

  • 默认配置:
    • train: data/train-*
    • test: data/test-*
    • validation: data/validation-*

任务类别

  • 问答
  • 文本生成
  • 文本到文本生成

语言

  • 英语

数据集大小类别

  • 10K<n<100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作