relhousieny/tokenized_lamini_gpt
收藏Hugging Face2023-11-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/relhousieny/tokenized_lamini_gpt
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: answer
dtype: string
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 2051927
num_examples: 1400
download_size: 676522
dataset_size: 2051927
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
relhousieny
原始信息汇总
数据集概述
特征信息
- 问题 (question): 数据类型为字符串 (string)
- 答案 (answer): 数据类型为字符串 (string)
- 输入ID (input_ids): 数据类型为整数序列 (int32)
- 注意力掩码 (attention_mask): 数据类型为整数序列 (int8)
- 标签 (labels): 数据类型为整数序列 (int64)
数据分割
- 训练集 (train):
- 字节数: 2051927
- 样本数: 1400
数据集大小
- 下载大小: 676522
- 数据集大小: 2051927
配置信息
- 默认配置 (default):
- 数据文件路径:
data/train-*
- 数据文件路径:



