allenai/swag
收藏数据集卡片:Situations With Adversarial Generations
数据集描述
数据集概述
SWAG(Situations With Adversarial Generations)是一个大规模的数据集,用于基于常识的推理任务,结合了自然语言推理和物理基础推理。数据集包含113k个关于基础场景的多项选择题(73k训练,20k验证,20k测试)。每个问题是一个来自LSMDC或ActivityNet Captions的视频字幕,有四个关于场景中接下来可能发生什么的答案选项。正确答案是视频中下一个事件的真实视频字幕;三个不正确的答案是敌对生成的并经过人工验证,以便欺骗机器而不是人类。SWAG旨在成为一个评估基础常识NLI和学习表示的基准。
支持的任务和排行榜
数据集引入了基于常识推理的任务,统一了自然语言推理和常识推理。
语言
数据集中的文本是英语。相关的BCP-47代码是en。
数据集结构
数据实例
regular配置应被用于建模。一个示例如下:
json { "video-id": "anetv_dm5WXFiQZUQ", "fold-ind": "18419", "startphrase": "He rides the motorcycle down the hall and into the elevator. He", "sent1": "He rides the motorcycle down the hall and into the elevator.", "sent2": "He", "gold-source": "gold", "ending0": "looks at a mirror in the mirror as he watches someone walk through a door.", "ending1": "stops, listening to a cup of coffee with the seated woman, whos standing.", "ending2": "exits the building and rides the motorcycle into a casino where he performs several tricks as people watch.", "ending3": "pulls the bag out of his pocket and hands it to someones grandma.", "label": 2 }
注意,测试集保留用于在排行榜上的盲提交。
数据字段
video-id: 标识符fold-ind: 标识符startphrase: 待填充的上下文sent1: 第一句话sent2: 第二句话的开始(待填充)gold-source: 生成或来自发现的完成ending0: 第一个选项ending1: 第二个选项ending2: 第三个选项ending3: 第四个选项label: 正确的选项
数据分割
数据集包含113k个多项选择题关于基础场景:73k用于训练,20k用于验证,20k用于(盲)测试。
数据集创建
策划理由
作者寻求数据集多样性同时最小化注释伪影,条件风格模式如长度和词偏好偏差。为了避免引入容易“被游戏”的模式,他们引入了敌对过滤(AF),一种一般适用的处理方法,涉及对一组分配的迭代细化,以增加在选定模型家族下的熵。数据集随后由付费众包人员进行人工验证。
源数据
初始数据收集和规范化
数据集源自ActivityNet Captions和Large Scale Movie Description Challenge中的连续视频字幕对。这两个数据集在性质上略有不同,使我们能够实现更广泛的覆盖:ActivityNet包含20k个YouTube剪辑,包含203种活动类型(如做体操或弹吉他);LSMDC包含128k个电影字幕(音频描述和剧本)。
注释
注释过程
注释首先由机器生成,然后进行敌对过滤。最后,剩余的示例由付费众包人员进行人工验证。
使用数据的注意事项
数据集的社会影响
[更多信息需要]
偏差的讨论
[更多信息需要]
其他已知限制
[更多信息需要]
附加信息
数据集策展人
[更多信息需要]
许可信息
未知
引用信息
bibtex @inproceedings{zellers2018swagaf, title={SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference}, author={Zellers, Rowan and Bisk, Yonatan and Schwartz, Roy and Choi, Yejin}, booktitle = "Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP)", year={2018} }
贡献
感谢@VictorSanh添加此数据集。




