coref-data/davis_wsc_raw
收藏数据集描述
数据集概述
原始的Winograd Schema Challenge (WSC)包含136个模式,产生273个问题。后来扩展到150个模式,产生285个问题。
Winograd模式是一对句子,它们只在单个或两个单词上有所不同,并且包含一个在两个句子中以相反方式解决的歧义,需要使用世界知识和推理来解决。
数据集结构
数据实例
每个实例包含一个带有指定代词的文本段落和两个可能的答案,指示代词在段落中代表的实体。示例实例如下:
python { label: 0, options: [The city councilmen, The demonstrators], pronoun: they, pronoun_loc: 63, quote: they feared violence, quote_loc: 63, source: (Winograd 1972), text: The city councilmen refused the demonstrators a permit because they feared violence. }
数据字段
text(str): 文本序列options(list[str]): 代词可能指代的两个实体选项label(int):options字段中正确选项的索引pronoun(str): 序列中待解决的代词pronoun_loc(int): 代词在序列中的起始位置quote(str): 包含代词的关键动作或上下文的子字符串quote_loc(int): 引文在序列中的起始位置source(str): 贡献示例的来源描述
许可信息
该工作根据Creative Commons Attribution 4.0 International License进行许可。
引用信息
Winograd Schema Challenge及其中的许多示例由Levesque等人于2012年提出:
@inproceedings{levesque2012winograd, title={The winograd schema challenge}, author={Levesque, Hector and Davis, Ernest and Morgenstern, Leora}, booktitle={Thirteenth International Conference on the Principles of Knowledge Representation and Reasoning}, year={2012}, organization={Citeseer} }




