hugosousa/natural_questions_parsed
收藏Hugging Face2023-12-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hugosousa/natural_questions_parsed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Natural Questions Parsed,包含自然语言处理中的问答数据。数据集的特征包括问题(question)、长答案(long_answer)、短答案(short_answers)、是否回答(yes_no_answer)、候选答案(candidates)、文档(document)和唯一标识符(id)。数据集分为训练集和验证集,分别包含307,373和7,830个样本。
该数据集名为Natural Questions Parsed,包含自然语言处理中的问答数据。数据集的特征包括问题(question)、长答案(long_answer)、短答案(short_answers)、是否回答(yes_no_answer)、候选答案(candidates)、文档(document)和唯一标识符(id)。数据集分为训练集和验证集,分别包含307,373和7,830个样本。
提供机构:
hugosousa
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: CC BY-SA 3.0
- 数据集名称: Natural Questions Parsed
数据集结构
特征
- question: 字符串类型
- long_answer: 字符串类型
- short_answers: 字符串序列
- yes_no_answer: 整数序列
- candidates: 字符串序列
- document: 字符串类型
- id: 字符串类型
数据分割
- 训练集:
- 字节数: 21949289652
- 样本数: 307373
- 验证集:
- 字节数: 533713369
- 样本数: 7830
数据集大小
- 下载大小: 11330809696 字节
- 数据集大小: 22483003021 字节
配置
- 配置名称: default
- 数据文件:
- 训练集: data/train-*
- 验证集: data/validation-*



