ErnestSDavis/winograd_wsc

Hugging Face2024-01-18 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/ErnestSDavis/winograd_wsc

下载链接

链接失效反馈

资源简介：

Winograd Schema Challenge数据集用于测试AI系统在常识性语言理解方面的能力。该数据集包含成对的句子，这些句子仅在少数词汇上有所不同，且包含需要通过世界知识和推理来解决的歧义。数据集由专家生成，包含285个测试实例，每个实例包含一个文本段落、一个指定的代词和两个可能的答案，指示代词在段落中代表哪个实体。数据集为英文，且仅包含测试集。

提供机构：

ErnestSDavis

原始信息汇总

数据集概述

名称: Winograd Schema Challenge
别名: WSC
语言: 英语
许可证: CC-BY-4.0
多语言性: 单语种
大小: 小于1000条数据
源数据: 原创数据
任务类别: 多选题
任务ID: 多选题-指代消解
论文代码ID: wsc
美观名称: Winograd Schema Challenge

数据集结构

配置信息

wsc285
- 特征:
  - text: 字符串
  - pronoun: 字符串
  - pronoun_loc: 整数
  - quote: 字符串
  - quote_loc: 整数
  - options: 字符串序列
  - label: 类别标签，值为0或1
  - source: 字符串
- 分割:
  - test: 285个实例，数据大小52281字节
- 下载大小: 113235字节
- 数据集大小: 52281字节
wsc273
- 特征:
  - text: 字符串
  - pronoun: 字符串
  - pronoun_loc: 整数
  - quote: 字符串
  - quote_loc: 整数
  - options: 字符串序列
  - label: 类别标签，值为0或1
  - source: 字符串
- 分割:
  - test: 273个实例，数据大小49674字节
- 下载大小: 113235字节
- 数据集大小: 49674字节

数据实例结构

文本: 包含指代词和两个可能答案的文本段落
选项: 指代词可能指代的两个实体
标签: 正确答案的索引
指代词: 需要解析的指代词
指代词位置: 指代词在序列中的起始位置
引用: 指代词周围的关键动作或上下文
引用位置: 引用在序列中的起始位置
来源: 贡献该实例的来源描述

搜集汇总

数据集介绍

构建方式

该数据集通过专家手动撰写的方式构建，每个实例都是根据Winograd schema模式创建的，包含两个在单词层面几乎相同但含义截然不同的句子。这些句子设计得易于人类读者分辨，但对于简单的技术如选择限制则难以解决。数据集中的实例经过专家的仔细校对，以确保其既不易被统计测试所解决，也不易通过简单的网络搜索得到答案。

特点

Winograd Schema Challenge数据集的主要特点在于其专注于评估AI系统在常识性语言理解方面的能力。每个实例都包含一个文本序列、一个代词、两个可能的答案选项以及正确答案的索引。数据集是单语种的，仅包含英语，且规模较小，包含不到一千个实例。此外，数据集的构建注重避免简单的解决策略，要求AI系统具备更深层次的理解和推理能力。

使用方法

使用该数据集时，用户可以通过测试分割来评估其模型在Winograd schema任务上的表现。数据集以JSON格式提供，其中每个实例都是一个包含文本、代词、答案选项和标签的对象。用户可以加载这个数据集，将其输入到模型中进行训练或测试，以评估模型在处理代词消解和常识推理任务上的性能。

背景与挑战

背景概述

Winograd Schema Challenge（WSC）数据集，源于1972年Terry Winograd提出的Winograd schema概念，旨在通过一对仅有一两个词差异的句子来考察人工智能在自然语言理解和推理方面的能力。该数据集由专家手工编写，包含了多个句子对，每对句子都含有一个由上下文决定的歧义代词，其正确解析需依赖世界知识和推理。Ernest Davis教授等研究人员于2012年提出此挑战，并将其作为评价AI系统常识性语言理解自动化的一种方式。WSC数据集在自然语言处理领域具有一定的影响力，推动了AI在理解复杂语境中代词歧义的能力的发展。

当前挑战

该数据集在构建和应用过程中面临的挑战包括：1）如何确保所构建的句子对在歧义性和可解析性之间保持平衡，既不过于简单也不过于复杂；2）如何避免数据集中的例子通过简单的统计方法被解决，确保需要真正的理解和推理能力；3）数据集在多大程度上能够反映真实世界中的语言使用情况，以及是否存在潜在的偏见和局限性；4）目前缺乏足够的标注信息来全面分析数据集中可能含有的个人和敏感信息。

常用场景

经典使用场景

Winograd Schema Challenge数据集被广泛应用于评估人工智能系统在自然语言理解和推理方面的能力。该数据集包含一系列精心设计的句子对，每对句子仅在代词指代的实体上存在细微差异，要求AI系统通过推理和世界知识来识别代词的正确指代。这种使用场景在自然语言处理领域具有重要的研究价值，因为它可以检验AI系统在处理复杂语义和代词消解方面的性能。

解决学术问题

该数据集解决了如何评估AI系统在理解和处理自然语言中的指代歧义问题上的能力。在学术研究中，Winograd Schema Challenge数据集被用来测试和比较不同模型在推理和代词消解任务上的表现，有助于推动自然语言理解技术的发展，并揭示了AI系统在处理复杂语言现象时的局限性。

衍生相关工作

基于Winograd Schema Challenge数据集，衍生出了一系列相关的研究工作，包括对数据集的扩展、不同语言版本的创建，以及对现有模型在代词消解任务上的改进。这些工作不仅推动了自然语言处理领域的研究，还为AI系统在理解复杂语言结构方面的进步提供了新的视角和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集