coref-data/superglue_wsc_raw
收藏Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coref-data/superglue_wsc_raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是SuperGLUE基准测试中的Winograd Schema Challenge示例,包含两个配置:wsc.fixed和wsc。每个配置都包含训练、验证和测试数据文件。数据集的具体字段包括文本、两个实体的起始索引、实体文本、示例索引以及一个布尔标签,用于指示两个实体是否共指。数据集主要用于自然语言理解系统的评估。
该数据集是SuperGLUE基准测试中的Winograd Schema Challenge示例,包含两个配置:wsc.fixed和wsc。每个配置都包含训练、验证和测试数据文件。数据集的具体字段包括文本、两个实体的起始索引、实体文本、示例索引以及一个布尔标签,用于指示两个实体是否共指。数据集主要用于自然语言理解系统的评估。
提供机构:
coref-data
原始信息汇总
Winograd Schema Challenge 示例包含在 SuperGLUE 基准测试中
具体来说,这是来自 HuggingFace "super_glue" 仓库的 wsc 和 wsc.fixed 数据集。
数据集配置
wsc.fixed
- 训练集:
wsc.fixed/train-*.parquet - 验证集:
wsc.fixed/validation-*.parquet - 测试集:
wsc.fixed/test-*.parquet
wsc
- 训练集:
wsc/train-*.parquet - 验证集:
wsc/validation-*.parquet - 测试集:
wsc/test-*.parquet
数据字段
text(str): 模式文本。span1_index(int): 第一个实体的起始词索引。span2_index(int): 第二个实体的起始词索引。span1_text(str): 第一个实体的文本表示。span2_text(str): 第二个实体的文本表示。idx(int): 数据集中示例的索引。label(bool): 如果两个实体共指,则为真。



