coref-data/mwsc_raw
收藏The Modified Winograd Schema Challenge (MWSC)
数据集描述
- 下载的数据集文件大小: 19.20 kB
- 生成的数据集大小: 39.35 kB
- 总磁盘使用量: 58.55 kB
数据集概述
该数据集是从Winograd Schema Challenge修改而来的示例,确保答案是上下文中的一个单词。这种修改后的Winograd Schema Challenge(MWSC)确保了评分既不会因措辞的古怪而膨胀,也不会因此而降低。
数据集结构
数据实例
默认
- 下载的数据集文件大小: 0.02 MB
- 生成的数据集大小: 0.04 MB
- 总磁盘使用量: 0.06 MB
一个示例如下: json { "sentence": "The city councilmen refused the demonstrators a permit because they feared violence.", "question": "Who feared violence?", "options": [ "councilmen", "demonstrators" ], "answer": "councilmen" }
数据字段
所有拆分中的数据字段相同。
默认
sentence:一个string特征。question:一个string特征。options:一个list的string特征。answer:一个string特征。
数据拆分
| 名称 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|
| 默认 | 80 | 82 | 100 |
许可信息
我们的decaNLP代码已根据BSD-3-Clause开源。
我们选择将decaNLP限制在免费且公开可访问的研究数据集上,但如果您偏离此用例,应检查它们的个别条款。
这两个版本的集合均根据Creative Commons Attribution 4.0 International License进行许可。
引用信息
如果您在工作中使用此数据集,请引用: bibtex @inproceedings{10.5555/3031843.3031909, author = {Levesque, Hector J. and Davis, Ernest and Morgenstern, Leora}, title = {The Winograd Schema Challenge}, year = {2012}, isbn = {9781577355601}, publisher = {AAAI Press}, booktitle = {Proceedings of the Thirteenth International Conference on Principles of Knowledge Representation and Reasoning}, pages = {552–561}, numpages = {10}, location = {Rome, Italy}, series = {KR12} }
@article{McCann2018decaNLP, title={The Natural Language Decathlon: Multitask Learning as Question Answering}, author={Bryan McCann and Nitish Shirish Keskar and Caiming Xiong and Richard Socher}, journal={arXiv preprint arXiv:1806.08730}, year={2018} }



