five

coref-data/superglue_wsc_raw

收藏
Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coref-data/superglue_wsc_raw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是SuperGLUE基准测试中的Winograd Schema Challenge示例,包含两个配置:wsc.fixed和wsc。每个配置都包含训练、验证和测试数据文件。数据集的具体字段包括文本、两个实体的起始索引、实体文本、示例索引以及一个布尔标签,用于指示两个实体是否共指。数据集主要用于自然语言理解系统的评估。

该数据集是SuperGLUE基准测试中的Winograd Schema Challenge示例,包含两个配置:wsc.fixed和wsc。每个配置都包含训练、验证和测试数据文件。数据集的具体字段包括文本、两个实体的起始索引、实体文本、示例索引以及一个布尔标签,用于指示两个实体是否共指。数据集主要用于自然语言理解系统的评估。
提供机构:
coref-data
原始信息汇总

Winograd Schema Challenge 示例包含在 SuperGLUE 基准测试中

具体来说,这是来自 HuggingFace "super_glue" 仓库的 wsc 和 wsc.fixed 数据集。

数据集配置

wsc.fixed

  • 训练集: wsc.fixed/train-*.parquet
  • 验证集: wsc.fixed/validation-*.parquet
  • 测试集: wsc.fixed/test-*.parquet

wsc

  • 训练集: wsc/train-*.parquet
  • 验证集: wsc/validation-*.parquet
  • 测试集: wsc/test-*.parquet

数据字段

  • text (str): 模式文本。
  • span1_index (int): 第一个实体的起始词索引。
  • span2_index (int): 第二个实体的起始词索引。
  • span1_text (str): 第一个实体的文本表示。
  • span2_text (str): 第二个实体的文本表示。
  • idx (int): 数据集中示例的索引。
  • label (bool): 如果两个实体共指,则为真。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作