Yogama/Employee
收藏Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Yogama/Employee
下载链接
链接失效反馈官方服务:
资源简介:
SciQ数据集包含了13,679个众包的科学考试问题,涉及物理、化学和生物学等多个领域。这些问题以多项选择题的形式出现,每个问题有4个答案选项。大多数问题还提供了一个额外的段落,用于支持正确答案的证据。数据集的结构包括训练集、验证集和测试集,分别包含11,679、1,000和1,000个样本。数据集的字段包括问题、三个干扰项、正确答案和支持性证据。
SciQ数据集包含了13,679个众包的科学考试问题,涉及物理、化学和生物学等多个领域。这些问题以多项选择题的形式出现,每个问题有4个答案选项。大多数问题还提供了一个额外的段落,用于支持正确答案的证据。数据集的结构包括训练集、验证集和测试集,分别包含11,679、1,000和1,000个样本。数据集的字段包括问题、三个干扰项、正确答案和支持性证据。
提供机构:
Yogama
原始信息汇总
数据集概述
基本信息
- 名称: SciQ
- 语言: 英语 (en)
- 许可证: Creative Commons Attribution-NonCommercial 3.0 Unported License (cc-by-nc-3.0)
- 多语言性: 单语种
- 大小: 10K<n<100K
- 源数据集: 原始数据
- 任务类别: 问答 (question-answering)
- 任务ID: 封闭领域问答 (closed-domain-qa)
- 论文代码ID: sciq
- 美观名称: SciQ
数据集结构
-
特征:
question: 字符串类型distractor3: 字符串类型distractor1: 字符串类型distractor2: 字符串类型correct_answer: 字符串类型support: 字符串类型
-
数据分割:
- 训练集: 11679个样本,大小6546183字节
- 验证集: 1000个样本,大小554120字节
- 测试集: 1000个样本,大小563927字节
数据集创建
- 语言创建者: 众包
- 标注创建者: 无标注
使用考虑
- 许可证信息: 数据集根据Creative Commons Attribution-NonCommercial 3.0 Unported License授权。
引用信息
@inproceedings{SciQ, title={Crowdsourcing Multiple Choice Science Questions}, author={Johannes Welbl, Nelson F. Liu, Matt Gardner}, year={2017}, journal={arXiv:1707.06209v1} }



