laurentiubp/rag-full-20000-en
收藏Hugging Face2024-06-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/laurentiubp/rag-full-20000-en
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:messages、category和language。messages是一个列表,包含content和role两个子特征,均为字符串类型。category和language也是字符串类型。数据集分为一个训练集(train),包含21792个样本,总大小为54342903字节。数据集的下载大小为32194188字节。数据集配置为默认(default),训练数据文件位于data/train-*路径。
该数据集包含三个主要特征:messages、category和language。messages是一个列表,包含content和role两个子特征,均为字符串类型。category和language也是字符串类型。数据集分为一个训练集(train),包含21792个样本,总大小为54342903字节。数据集的下载大小为32194188字节。数据集配置为默认(default),训练数据文件位于data/train-*路径。
提供机构:
laurentiubp
原始信息汇总
数据集概述
数据集信息
- 特征:
- messages:
- content: 数据类型为字符串
- role: 数据类型为字符串
- category: 数据类型为字符串
- language: 数据类型为字符串
- messages:
数据集分割
- train:
- num_bytes: 54342903
- num_examples: 21792
数据集大小
- download_size: 32194188
- dataset_size: 54342903
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



