bhadauriaupendra062/questionansweridsattentionmaskdata
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/bhadauriaupendra062/questionansweridsattentionmaskdata
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含问题和答案对,以及对应的输入ID序列和注意力掩码序列。数据集分为一个训练集,包含3925个样本,总大小为744493字节。下载大小为125377字节。数据集的配置文件名为default,数据文件路径为data/train-*。
This dataset contains question and answer pairs, along with corresponding input ID sequences and attention mask sequences. The dataset is divided into a training set containing 3925 samples, with a total size of 744493 bytes. The download size is 125377 bytes. The configuration file for the dataset is named default, and the data file path is data/train-*.
提供机构:
bhadauriaupendra062
原始信息汇总
数据集概述
数据集特征
- question: 问题,数据类型为字符串。
- answer: 答案,数据类型为字符串。
- input_ids: 输入ID序列,数据类型为32位整数。
- attention_mask: 注意力掩码序列,数据类型为8位整数。
数据集分割
- train: 训练集,包含3925个样本,占用744493字节。
数据集大小
- 下载大小: 125377字节
- 数据集大小: 744493字节
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



