PiyushLavaniya/Alpaca_Instruct_Processed_train_ready
收藏Hugging Face2023-10-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PiyushLavaniya/Alpaca_Instruct_Processed_train_ready
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
dataset_info:
features:
- name: input
dtype: string
- name: output
dtype: string
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 93680964.0
num_examples: 46800
- name: test
num_bytes: 10408996.0
num_examples: 5200
download_size: 32202704
dataset_size: 104089960.0
---
# Dataset Card for "Alpaca_Instruct_Processed_train_ready"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 数据集拆分:训练集,路径:data/train-*
- 数据集拆分:测试集,路径:data/test-*
数据集信息:
特征字段:
- 名称:输入(input),数据类型:字符串(string)
- 名称:输出(output),数据类型:字符串(string)
- 名称:输入标识符(input_ids),数据序列:int32 类型
- 名称:注意力掩码(attention_mask),数据序列:int8 类型
- 名称:标签(labels),数据序列:int64 类型
数据集拆分详情:
- 名称:训练集,字节数:93680964.0,样本数:46800
- 名称:测试集,字节数:10408996.0,样本数:5200
下载大小:32202704
总数据集大小:104089960.0
---
# 「Alpaca_Instruct_Processed_train_ready」数据集卡片
[更多信息待补充](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
PiyushLavaniya
原始信息汇总
数据集概述
配置
- 默认配置 (
default)- 数据文件路径:
- 训练集 (
train):data/train-* - 测试集 (
test):data/test-*
- 训练集 (
- 数据文件路径:
数据集信息
-
特征:
input: 字符串类型 (string)output: 字符串类型 (string)input_ids: 整数序列 (int32)attention_mask: 整数序列 (int8)labels: 整数序列 (int64)
-
数据分割:
- 训练集 (
train)- 字节数: 93680964.0
- 样本数: 46800
- 测试集 (
test)- 字节数: 10408996.0
- 样本数: 5200
- 训练集 (
-
数据集大小:
- 下载大小: 32202704
- 数据集大小: 104089960.0



