five

coref-data/mwsc_raw

收藏
Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coref-data/mwsc_raw
下载链接
链接失效反馈
官方服务:
资源简介:
Modified Winograd Schema Challenge (MWSC)是一个经过修改的数据集,源自Winograd Schema Challenge,确保答案为上下文中的单个单词。该数据集旨在测试在句子中解析指代歧义的能力,包含句子、问题、选项和答案等数据字段。数据集遵循Creative Commons Attribution 4.0 International License,并提供了详细的引用信息。

Modified Winograd Schema Challenge (MWSC)是一个经过修改的数据集,源自Winograd Schema Challenge,确保答案为上下文中的单个单词。该数据集旨在测试在句子中解析指代歧义的能力,包含句子、问题、选项和答案等数据字段。数据集遵循Creative Commons Attribution 4.0 International License,并提供了详细的引用信息。
提供机构:
coref-data
原始信息汇总

The Modified Winograd Schema Challenge (MWSC)

数据集描述

  • 下载的数据集文件大小: 19.20 kB
  • 生成的数据集大小: 39.35 kB
  • 总磁盘使用量: 58.55 kB

数据集概述

该数据集是从Winograd Schema Challenge修改而来的示例,确保答案是上下文中的一个单词。这种修改后的Winograd Schema Challenge(MWSC)确保了评分既不会因措辞的古怪而膨胀,也不会因此而降低。

数据集结构

数据实例

默认

  • 下载的数据集文件大小: 0.02 MB
  • 生成的数据集大小: 0.04 MB
  • 总磁盘使用量: 0.06 MB

一个示例如下: json { "sentence": "The city councilmen refused the demonstrators a permit because they feared violence.", "question": "Who feared violence?", "options": [ "councilmen", "demonstrators" ], "answer": "councilmen" }

数据字段

所有拆分中的数据字段相同。

默认

  • sentence:一个string特征。
  • question:一个string特征。
  • options:一个liststring特征。
  • answer:一个string特征。

数据拆分

名称 训练集 验证集 测试集
默认 80 82 100

许可信息

我们的decaNLP代码已根据BSD-3-Clause开源。

我们选择将decaNLP限制在免费且公开可访问的研究数据集上,但如果您偏离此用例,应检查它们的个别条款。

Winograd Schema Challenge

这两个版本的集合均根据Creative Commons Attribution 4.0 International License进行许可。

引用信息

如果您在工作中使用此数据集,请引用: bibtex @inproceedings{10.5555/3031843.3031909, author = {Levesque, Hector J. and Davis, Ernest and Morgenstern, Leora}, title = {The Winograd Schema Challenge}, year = {2012}, isbn = {9781577355601}, publisher = {AAAI Press}, booktitle = {Proceedings of the Thirteenth International Conference on Principles of Knowledge Representation and Reasoning}, pages = {552–561}, numpages = {10}, location = {Rome, Italy}, series = {KR12} }

@article{McCann2018decaNLP, title={The Natural Language Decathlon: Multitask Learning as Question Answering}, author={Bryan McCann and Nitish Shirish Keskar and Caiming Xiong and Richard Socher}, journal={arXiv preprint arXiv:1806.08730}, year={2018} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作