tau/commonsense_qa
收藏数据集概述
基本信息
- 名称: CommonsenseQA
- 语言: 英语 (
en) - 许可证: MIT
- 多语言性: 单语
- 大小: 1K<n<10K
- 源数据: 原始数据
- 任务类别: 问答
- 任务ID: open-domain-qa
- 论文代码ID: commonsenseqa
- 美观名称: CommonsenseQA
数据集结构
- 特征:
id: 字符串类型,唯一ID。question: 字符串类型,问题描述。question_concept: 字符串类型,与问题相关的概念。choices: 字典类型,包含选项标签和文本。label: 字符串类型,选项标签。text: 字符串类型,选项文本。
answerKey: 字符串类型,正确答案。
- 数据分割:
train: 9741个样本,2207794字节。validation: 1221个样本,273848字节。test: 1140个样本,257842字节。- 总下载大小: 1558570字节。
- 数据集总大小: 2739484字节。
数据集创建
- 注释创建者: 众包
- 语言创建者: 众包
使用考虑
-
许可证: MIT,详细信息见此链接。
-
引用信息:
@inproceedings{talmor-etal-2019-commonsenseqa, title = "{C}ommonsense{QA}: A Question Answering Challenge Targeting Commonsense Knowledge", author = "Talmor, Alon and Herzig, Jonathan and Lourie, Nicholas and Berant, Jonathan", booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)", month = jun, year = "2019", address = "Minneapolis, Minnesota", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/N19-1421", doi = "10.18653/v1/N19-1421", pages = "4149--4158", archivePrefix = "arXiv", eprint = "1811.00937", primaryClass = "cs", }
贡献者




