mu1990/Winospan

Name: mu1990/Winospan
Creator: mu1990
Published: 2023-03-24 23:38:27
License: 暂无描述

Hugging Face2023-03-24 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/mu1990/Winospan

下载链接

链接失效反馈

官方服务：

资源简介：

Winograd Schema Challenge（WSC）数据集由Levesque, Davis和Morgenstern于2012年提出，基于Terry Winograd和Eugene Charniak的工作，旨在评估自然语言理解能力。该数据集包含一对句子，这些句子在一两个词上有所不同，并且包含指代歧义。构建数据集时需要考虑五个特征：1. 句子不能通过统计或语法信息解决；2. 句子中提及两个实体；3. 使用代词指代其中一个实体；4. 问题始终是确定代词的指代对象；5. 每个句子中有两个特殊词用于填充模式。

提供机构：

mu1990

原始信息汇总

数据集概述

数据集名称

WSC (Winograd Schema Challenge)

数据集来源

由Levesque, Davis和Morgenstern在2012年提出，基于Terry Winograd (1972) 和 Eugene Charniak (1974) 的工作。

数据集特点

语言理解挑战：数据集包含一对句子，这些句子在单词数量上有所不同，并包含指代歧义。
非统计或语法解决：句子不能仅通过统计信息（如单词共现）或语法结构来解决。
实体提及：每句话中提到两个实体，通过名词短语表达。
使用代词：使用代词（如“他”、“她”、“它”或“他们”）来指代其中一个实体。
固定问题：问题始终是询问代词的指代对象。
特殊词汇：每句话中有两个特殊词汇，正确答案取决于选择哪个特殊词汇。

数据集用途

评估自然语言理解能力。

许可协议

MIT

5,000+

优质数据集

54 个

任务类型

进入经典数据集