wisenut-nlp-team/aihub_mrc_admin
收藏Hugging Face2023-05-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wisenut-nlp-team/aihub_mrc_admin
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个针对行政文档的机器阅读理解(MRC)数据集,包含上下文、文档ID、文档标题、文档来源、文档发布时间、文档分类、创建时间、问答类型、问题ID、问题、是否不可能、答案等特征。数据集分为训练集和验证集,训练集包含329,464个示例,验证集包含41,182个示例。数据集的标签包括机器阅读理解(MRC),任务类别包括问答,任务ID包括抽取式问答和封闭域问答。
提供机构:
wisenut-nlp-team
原始信息汇总
数据集概述
数据集特征
- context:字符串类型
- doc_id:字符串类型
- doc_title:字符串类型
- doc_source:字符串类型
- doc_published:整数类型
- doc_class:结构体类型,包含:
- class:字符串类型
- code:字符串类型
- created:字符串类型
- qa_type:整数类型
- question_id:字符串类型
- question:字符串类型
- is_impossible:布尔类型
- answers:结构体类型,包含:
- answer_start:整数类型
- clue_start:整数类型
- clue_text:字符串类型
- options:字符串序列
- text:字符串类型
数据集分割
- train:
- 数据量:646034916字节
- 示例数:329464
- validation:
- 数据量:80855200字节
- 示例数:41182
数据集大小
- 下载大小:243811004字节
- 数据集总大小:726890116字节



