mu1990/Winospan
收藏Hugging Face2023-03-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mu1990/Winospan
下载链接
链接失效反馈官方服务:
资源简介:
Winograd Schema Challenge(WSC)数据集由Levesque, Davis和Morgenstern于2012年提出,基于Terry Winograd和Eugene Charniak的工作,旨在评估自然语言理解能力。该数据集包含一对句子,这些句子在一两个词上有所不同,并且包含指代歧义。构建数据集时需要考虑五个特征:1. 句子不能通过统计或语法信息解决;2. 句子中提及两个实体;3. 使用代词指代其中一个实体;4. 问题始终是确定代词的指代对象;5. 每个句子中有两个特殊词用于填充模式。
Winograd Schema Challenge(WSC)数据集由Levesque, Davis和Morgenstern于2012年提出,基于Terry Winograd和Eugene Charniak的工作,旨在评估自然语言理解能力。该数据集包含一对句子,这些句子在一两个词上有所不同,并且包含指代歧义。构建数据集时需要考虑五个特征:1. 句子不能通过统计或语法信息解决;2. 句子中提及两个实体;3. 使用代词指代其中一个实体;4. 问题始终是确定代词的指代对象;5. 每个句子中有两个特殊词用于填充模式。
提供机构:
mu1990
原始信息汇总
数据集概述
数据集名称
WSC (Winograd Schema Challenge)
数据集来源
由Levesque, Davis和Morgenstern在2012年提出,基于Terry Winograd (1972) 和 Eugene Charniak (1974) 的工作。
数据集特点
- 语言理解挑战:数据集包含一对句子,这些句子在单词数量上有所不同,并包含指代歧义。
- 非统计或语法解决:句子不能仅通过统计信息(如单词共现)或语法结构来解决。
- 实体提及:每句话中提到两个实体,通过名词短语表达。
- 使用代词:使用代词(如“他”、“她”、“它”或“他们”)来指代其中一个实体。
- 固定问题:问题始终是询问代词的指代对象。
- 特殊词汇:每句话中有两个特殊词汇,正确答案取决于选择哪个特殊词汇。
数据集用途
评估自然语言理解能力。
许可协议
MIT



