shivanshtri010/orca-processed

Name: shivanshtri010/orca-processed
Creator: shivanshtri010
Published: 2024-07-08 19:23:54
License: 暂无描述

Hugging Face2024-07-08 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/shivanshtri010/orca-processed

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含训练数据，主要用于问答系统的训练。数据集的特征包括id、系统提示（system_prompt）、问题（question）和回答（response）。数据被分为一个训练集，包含1,560,340个示例，总大小为3,325,887,528字节。

This dataset contains training data primarily used for training question-answering systems. The features of the dataset include id, system prompt, question, and response. The data is divided into a training set containing 1,560,340 examples, with a total size of 3,325,887,528 bytes.

提供机构：

shivanshtri010

原始信息汇总

数据集概述

数据集特征

id: 数据项的唯一标识符，数据类型为字符串。
system_prompt: 系统提示信息，数据类型为字符串。
question: 问题内容，数据类型为字符串。
response: 响应内容，数据类型为字符串。

数据集划分

train: 训练数据集，包含1,560,340个样本，总大小为3,325,887,528字节。

数据集大小

下载大小: 1,861,248,938字节
数据集总大小: 3,325,887,528字节

配置信息

config_name: default
- data_files:
  - split: train
  - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集