five

Yogama/Employee

收藏
Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Yogama/Employee
下载链接
链接失效反馈
官方服务:
资源简介:
SciQ数据集包含了13,679个众包的科学考试问题,涉及物理、化学和生物学等多个领域。这些问题以多项选择题的形式出现,每个问题有4个答案选项。大多数问题还提供了一个额外的段落,用于支持正确答案的证据。数据集的结构包括训练集、验证集和测试集,分别包含11,679、1,000和1,000个样本。数据集的字段包括问题、三个干扰项、正确答案和支持性证据。

SciQ数据集包含了13,679个众包的科学考试问题,涉及物理、化学和生物学等多个领域。这些问题以多项选择题的形式出现,每个问题有4个答案选项。大多数问题还提供了一个额外的段落,用于支持正确答案的证据。数据集的结构包括训练集、验证集和测试集,分别包含11,679、1,000和1,000个样本。数据集的字段包括问题、三个干扰项、正确答案和支持性证据。
提供机构:
Yogama
原始信息汇总

数据集概述

基本信息

  • 名称: SciQ
  • 语言: 英语 (en)
  • 许可证: Creative Commons Attribution-NonCommercial 3.0 Unported License (cc-by-nc-3.0)
  • 多语言性: 单语种
  • 大小: 10K<n<100K
  • 源数据集: 原始数据
  • 任务类别: 问答 (question-answering)
  • 任务ID: 封闭领域问答 (closed-domain-qa)
  • 论文代码ID: sciq
  • 美观名称: SciQ

数据集结构

  • 特征:

    • question: 字符串类型
    • distractor3: 字符串类型
    • distractor1: 字符串类型
    • distractor2: 字符串类型
    • correct_answer: 字符串类型
    • support: 字符串类型
  • 数据分割:

    • 训练集: 11679个样本,大小6546183字节
    • 验证集: 1000个样本,大小554120字节
    • 测试集: 1000个样本,大小563927字节

数据集创建

  • 语言创建者: 众包
  • 标注创建者: 无标注

使用考虑

  • 许可证信息: 数据集根据Creative Commons Attribution-NonCommercial 3.0 Unported License授权。

引用信息

@inproceedings{SciQ, title={Crowdsourcing Multiple Choice Science Questions}, author={Johannes Welbl, Nelson F. Liu, Matt Gardner}, year={2017}, journal={arXiv:1707.06209v1} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作