allenai/sciq|科学教育数据集|自然语言处理数据集
收藏数据集概述
基本信息
- 数据集名称: SciQ
- 语言: 英语 (en)
- 许可证: Creative Commons Attribution-NonCommercial 3.0 Unported License (cc-by-nc-3.0)
- 多语言性: 单语种
- 数据集大小: 10K<n<100K
- 源数据: 原始数据
- 任务类别: 问答 (question-answering)
- 任务ID: 封闭领域问答 (closed-domain-qa)
- 论文代码ID: sciq
- 美观名称: SciQ
数据集结构
-
特征:
question
: 字符串类型distractor3
: 字符串类型distractor1
: 字符串类型distractor2
: 字符串类型correct_answer
: 字符串类型support
: 字符串类型
-
数据分割:
train
: 11679个样本,6546183字节validation
: 1000个样本,554120字节test
: 1000个样本,563927字节
数据集创建
- 语言创建者: 众包
- 注释创建者: 无注释
使用考虑
- 许可证信息: 数据集根据Creative Commons Attribution-NonCommercial 3.0 Unported License授权。
引用信息
@inproceedings{SciQ, title={Crowdsourcing Multiple Choice Science Questions}, author={Johannes Welbl, Nelson F. Liu, Matt Gardner}, year={2017}, journal={arXiv:1707.06209v1} }
贡献者

China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
QM9
QM9数据集包含134k个有机小分子化合物的量子化学计算结果,涵盖了12个量子化学性质,如分子能量、电离能、电子亲和能等。
quantum-machine.org 收录
LUNA16
LUNA16(肺结节分析)数据集是用于肺分割的数据集。它由 1,186 个肺结节组成,在 888 次 CT 扫描中进行了注释。
OpenDataLab 收录