AnoopChandra/orca-cleaned-simple-data

Name: AnoopChandra/orca-cleaned-simple-data
Creator: AnoopChandra
Published: 2024-03-02 10:22:00
License: 暂无描述

Hugging Face2024-03-02 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/AnoopChandra/orca-cleaned-simple-data

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: id dtype: string - name: system_prompt dtype: string - name: question dtype: string - name: response dtype: string - name: __index_level_0__ dtype: int64 splits: - name: train num_bytes: 20165050 num_examples: 9120 download_size: 11238813 dataset_size: 20165050 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征字段： - 名称：id，数据类型：字符串 - 名称：系统提示词（system prompt），数据类型：字符串 - 名称：问题，数据类型：字符串 - 名称：回复，数据类型：字符串 - 名称：__index_level_0__，数据类型：64位整数划分集： - 划分名称：训练集（train），字节数：20165050，样本数量：9120 下载大小：11238813 数据集总大小：20165050 配置项： - 配置名称：默认（default）数据文件： - 对应划分：训练集（train），文件路径：data/train-*

提供机构：

AnoopChandra

原始信息汇总

数据集概述

数据集特征

id: 字符串类型
system_prompt: 字符串类型
question: 字符串类型
response: 字符串类型
index_level_0: 整数类型

数据集分割

train: 包含9120个样本，占用20165050字节

数据集大小

下载大小: 11238813字节
数据集大小: 20165050字节

配置

default:
- 数据文件:
  - train: 路径为data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集