PartiallyTyped/answerable_tydiqa_preprocessed
收藏Hugging Face2022-11-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PartiallyTyped/answerable_tydiqa_preprocessed
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: language
dtype: string
- name: question
dtype: string
- name: context
dtype: string
- name: references
struct:
- name: answers
struct:
- name: answer_start
sequence: int64
- name: text
sequence: string
- name: id
dtype: string
- name: id
dtype: string
splits:
- name: train
num_bytes: 21252073.336011786
num_examples: 29800
- name: validation
num_bytes: 2657400.5792025863
num_examples: 3709
download_size: 16838253
dataset_size: 23909473.91521437
---
# Dataset Card for "answerable_tydiqa_preprocessed"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
PartiallyTyped
原始信息汇总
数据集信息
特征
- language: 数据类型为字符串。
- question: 数据类型为字符串。
- context: 数据类型为字符串。
- references: 结构化数据,包含以下字段:
- answers: 结构化数据,包含以下字段:
- answer_start: 数据类型为整数序列。
- text: 数据类型为字符串序列。
- id: 数据类型为字符串。
- answers: 结构化数据,包含以下字段:
- id: 数据类型为字符串。
数据分割
- train: 包含29800个样本,占用21252073.336011786字节。
- validation: 包含3709个样本,占用2657400.5792025863字节。
数据集大小
- 下载大小: 16838253字节。
- 数据集大小: 23909473.91521437字节。



