five

coref-data/davis_pdp_raw

收藏
Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coref-data/davis_pdp_raw
下载链接
链接失效反馈
官方服务:
资源简介:
Pronoun Disambiguation Problems (PDP)数据集包含60个代词消歧问题,源自2016年的Winograd Schema Challenge (WSC)。数据集的字段包括文本序列、代词、代词位置、引用文本、引用位置、选项、标签和来源描述。这些数据用于解决代词在文本中的指代问题,帮助模型理解上下文中的代词指代关系。

Pronoun Disambiguation Problems (PDP)数据集包含60个代词消歧问题,源自2016年的Winograd Schema Challenge (WSC)。数据集的字段包括文本序列、代词、代词位置、引用文本、引用位置、选项、标签和来源描述。这些数据用于解决代词在文本中的指代问题,帮助模型理解上下文中的代词指代关系。
提供机构:
coref-data
原始信息汇总

数据集概述

数据集信息

  • 配置名称: davis_pdp
  • 特征:
    • text (字符串): 文本序列
    • pronoun (字符串): 序列中的代词
    • pronoun_loc (整数): 代词在序列中的起始位置
    • quote (字符串): 包含关键动作或上下文的子字符串
    • quote_loc (整数): 引用的起始位置
    • options (字符串序列): 代词可能指代的两个实体选项
    • label (整数): options 字段中正确选项的索引
    • humanSubjects (字符串): 人类主体
    • source (字符串): 贡献示例的来源描述

数据分割

  • 测试集:
    • 名称: test
    • 字节数: 20098
    • 样本数: 60

数据文件

  • 配置名称: davis_pdp
  • 数据文件:
    • 分割: test
    • 路径: davis_pdp/test-*

数据集大小

  • 下载大小: 14796 字节
  • 数据集大小: 20098 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作