tyzhu/squad_qa_title_v5_full_recite_full_passage_qaonly
收藏Hugging Face2024-03-29 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/tyzhu/squad_qa_title_v5_full_recite_full_passage_qaonly
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: title
dtype: string
- name: context
dtype: string
- name: question
dtype: string
- name: answers
sequence:
- name: text
dtype: string
- name: answer_start
dtype: int32
- name: answer
dtype: string
- name: context_id
dtype: string
- name: inputs
dtype: string
- name: targets
dtype: string
splits:
- name: train
num_bytes: 4388570.289940828
num_examples: 2385
- name: validation
num_bytes: 590772
num_examples: 300
download_size: 1036677
dataset_size: 4979342.289940828
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
提供机构:
tyzhu
原始信息汇总
数据集概述
特征信息
- id: 数据类型为字符串。
- title: 数据类型为字符串。
- context: 数据类型为字符串。
- question: 数据类型为字符串。
- answers: 包含两个子特征:
- text: 数据类型为字符串。
- answer_start: 数据类型为整数(int32)。
- answer: 数据类型为字符串。
- context_id: 数据类型为字符串。
- inputs: 数据类型为字符串。
- targets: 数据类型为字符串。
数据分割
- train: 包含2385个样本,大小为4388570.289940828字节。
- validation: 包含300个样本,大小为590772字节。
数据集大小
- 下载大小: 1036677字节。
- 数据集大小: 4979342.289940828字节。
配置信息
- default:
- train: 文件路径为
data/train-*。 - validation: 文件路径为
data/validation-*。
- train: 文件路径为



