wisenut-nlp-team/aihub_mrc_commonsense
收藏Hugging Face2023-07-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wisenut-nlp-team/aihub_mrc_commonsense
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个关于常识的问答数据集,包含标题、上下文、问题和答案等特征。数据集分为训练集和验证集,分别包含90241和10027个样本。数据集的创建者是众包的,语言未指定,许可证为CC-BY-4.0,数据集大小在10M到100M之间,任务类型包括抽取式问答和开放域问答。
该数据集是一个关于常识的问答数据集,包含标题、上下文、问题和答案等特征。数据集分为训练集和验证集,分别包含90241和10027个样本。数据集的创建者是众包的,语言未指定,许可证为CC-BY-4.0,数据集大小在10M到100M之间,任务类型包括抽取式问答和开放域问答。
提供机构:
wisenut-nlp-team
原始信息汇总
数据集概述
数据集名称
- 名称: mrc_aihub_common_sense
- 别名: wisenut-nlp-team/aihub_mrc_commonsense
数据集特征
- 特征列表:
title: 数据类型 - stringcontext: 数据类型 - stringquestion: 数据类型 - stringid: 数据类型 - stringanswers: 结构化数据answer_start: 数据类型 - int64text: 数据类型 - string
数据集分割
- 训练集:
- 示例数量: 90241
- 数据大小: 104471982.66005106 字节
- 验证集:
- 示例数量: 10027
- 数据大小: 11608255.339948937 字节
数据集大小
- 下载大小: 74958899 字节
- 数据集总大小: 116080238.0 字节
数据集类别与任务
- 任务类别: question-answering
- 任务ID:
- extractive-qa
- open-domain-qa
数据集来源
- 来源: original
数据集规模
- 规模: 10M<n<100M



