zzzzhhh/test_data

Name: zzzzhhh/test_data
Creator: zzzzhhh
Published: 2024-01-29 12:47:05
License: 暂无描述

Hugging Face2024-01-29 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/zzzzhhh/test_data

下载链接

链接失效反馈

官方服务：

资源简介：

SuperGLUE是一个新的基准测试，模仿GLUE，包含一组更困难的语言理解任务，改进了资源，并有一个新的公共排行榜。BoolQ（布尔问题，Clark等人，2019a）是一个问答任务，每个例子由一个简短的段落和一个关于段落的yes/no问题组成。问题是由Google搜索引擎用户匿名且未经请求提供的，随后与包含答案的维基百科文章段落配对。我们按照原始工作，使用准确性进行评估。

提供机构：

zzzzhhh

原始信息汇总

数据集概述

基本信息

名称: SuperGLUE
语言: 英语（en）
许可证: 未知
多语言性: 单语
大小: 10K<n<100K
来源: 扩展自其他数据集
任务类别: 文本分类、令牌分类、问答
任务ID: 自然语言推理、词义消歧、共指消解、抽取式问答
标签: superglue, NLU, 自然语言理解

数据集配置

boolq
- 特征:
  - question: 字符串
  - passage: 字符串
  - idx: 整数32位
  - label: 分类标签（0: False, 1: True）
- 分割:
  - 训练: 9427个样本
  - 验证: 3270个样本
  - 测试: 3245个样本
- 数据集大小: 10405708字节
cb
- 特征:
  - premise: 字符串
  - hypothesis: 字符串
  - idx: 整数32位
  - label: 分类标签（0: entailment, 1: contradiction, 2: neutral）
- 分割:
  - 训练: 250个样本
  - 验证: 56个样本
  - 测试: 250个样本
- 数据集大小: 202772字节
copa
- 特征:
  - premise: 字符串
  - choice1: 字符串
  - choice2: 字符串
  - question: 字符串
  - idx: 整数32位
  - label: 分类标签（0: choice1, 1: choice2）
- 分割:
  - 训练: 400个样本
  - 验证: 100个样本
  - 测试: 500个样本
- 数据集大小: 122488字节
multirc
- 特征:
  - paragraph: 字符串
  - question: 字符串
  - answer: 字符串
  - idx: 结构化（paragraph, question, answer均为整数32位）
  - label: 分类标签（0: False, 1: True）
- 分割:
  - 训练: 27243个样本
  - 验证: 4848个样本
  - 测试: 9693个样本
- 数据集大小: 68968948字节
record
- 特征:
  - passage: 字符串
  - query: 字符串
  - entities: 字符串序列
  - entity_spans: 结构化（text: 字符串, start: 整数32位, end: 整数32位）
  - answers: 字符串序列
  - idx: 结构化（passage, query均为整数32位）
- 分割:
  - 训练: 100730个样本
  - 验证: 10000个样本
  - 测试: 10000个样本
- 数据集大小: 213911711字节
rte
- 特征:
  - premise: 字符串
  - hypothesis: 字符串
  - idx: 整数32位
  - label: 分类标签（0: entailment, 1: not_entailment）
- 分割:
  - 训练: 2490个样本
  - 验证: 277个样本
  - 测试: 3000个样本
- 数据集大小: 1915443字节
wic
- 特征:
  - word: 字符串
  - sentence1: 字符串
  - sentence2: 字符串
  - start1: 整数32位
  - start2: 整数32位
  - end1: 整数32位
  - end2: 整数32位
  - idx: 整数32位
  - label: 分类标签（0: False, 1: True）
- 分割:
  - 训练: 5428个样本
  - 验证: 638个样本
  - 测试: 1400个样本
- 数据集大小: 928399字节
wsc
- 特征:
  - text: 字符串
  - span1_index: 整数32位
  - span2_index: 整数32位
  - span1_text: 字符串
  - span2_text: 字符串
  - idx: 整数32位
  - label: 分类标签（0: False, 1: True）
- 分割:
  - 训练: 554个样本
  - 验证: 104个样本
  - 测试: 146个样本
- 数据集大小: 143092字节
wsc.fixed
- 特征:
  - text: 字符串
  - span1_index: 整数32位
  - span2_index: 整数32位
  - span1_text: 字符串
  - span2_text: 字符串
  - idx: 整数32位
  - label: 分类标签（0: False, 1: True）
- 分割:
  - 训练: 554个样本
  - 验证: 104个样本
  - 测试: 146个样本
- 数据集大小: 143088字节
axb
- 特征:
  - sentence1: 字符串
  - sentence2: 字符串
  - idx: 整数32位
  - label: 分类标签（0: entailment, 1: not_entailment）
- 分割:
  - 测试: 1104个样本
- 数据集大小: 238392字节
axg
- 特征:
  - premise: 字符串
  - hypothesis: 字符串
  - idx: 整数32位
  - label: 分类标签（0: entailment, 1: not_entailment）
- 分割:
  - 测试: 356个样本
- 数据集大小: 53581字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集