five

mu1990/Winospan

收藏
Hugging Face2023-03-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mu1990/Winospan
下载链接
链接失效反馈
官方服务:
资源简介:
Winograd Schema Challenge(WSC)数据集由Levesque, Davis和Morgenstern于2012年提出,基于Terry Winograd和Eugene Charniak的工作,旨在评估自然语言理解能力。该数据集包含一对句子,这些句子在一两个词上有所不同,并且包含指代歧义。构建数据集时需要考虑五个特征:1. 句子不能通过统计或语法信息解决;2. 句子中提及两个实体;3. 使用代词指代其中一个实体;4. 问题始终是确定代词的指代对象;5. 每个句子中有两个特殊词用于填充模式。

Winograd Schema Challenge(WSC)数据集由Levesque, Davis和Morgenstern于2012年提出,基于Terry Winograd和Eugene Charniak的工作,旨在评估自然语言理解能力。该数据集包含一对句子,这些句子在一两个词上有所不同,并且包含指代歧义。构建数据集时需要考虑五个特征:1. 句子不能通过统计或语法信息解决;2. 句子中提及两个实体;3. 使用代词指代其中一个实体;4. 问题始终是确定代词的指代对象;5. 每个句子中有两个特殊词用于填充模式。
提供机构:
mu1990
原始信息汇总

数据集概述

数据集名称

WSC (Winograd Schema Challenge)

数据集来源

由Levesque, Davis和Morgenstern在2012年提出,基于Terry Winograd (1972) 和 Eugene Charniak (1974) 的工作。

数据集特点

  1. 语言理解挑战:数据集包含一对句子,这些句子在单词数量上有所不同,并包含指代歧义。
  2. 非统计或语法解决:句子不能仅通过统计信息(如单词共现)或语法结构来解决。
  3. 实体提及:每句话中提到两个实体,通过名词短语表达。
  4. 使用代词:使用代词(如“他”、“她”、“它”或“他们”)来指代其中一个实体。
  5. 固定问题:问题始终是询问代词的指代对象。
  6. 特殊词汇:每句话中有两个特殊词汇,正确答案取决于选择哪个特殊词汇。

数据集用途

评估自然语言理解能力。

许可协议

MIT

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作