severo/glue
收藏Hugging Face2022-10-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/severo/glue
下载链接
链接失效反馈官方服务:
资源简介:
GLUE(通用语言理解评估基准)是一个用于训练、评估和分析自然语言理解系统的资源集合。它包括多个任务,如文本分类、自然语言推理和语义相似性评分。数据集是单语言的(英语),并且属于文本分类任务类别。它包括多个配置和任务的分割,每个任务都有特定的数据字段和示例。
提供机构:
severo
原始信息汇总
数据集概述
数据集名称
GLUE (General Language Understanding Evaluation benchmark)
数据集基本信息
- 语言: 英语 (
en) - 许可证: CC-BY-4.0
- 多语言性: 单语种
- 大小类别: 10K<n<100K
- 源数据集: 原始数据
- 任务类别: 文本分类
- 任务ID:
- acceptability-classification
- natural-language-inference
- semantic-similarity-scoring
- sentiment-classification
- text-scoring
数据集结构
- 数据实例: 详细描述了每个任务的数据实例结构,包括字段如
premise,hypothesis,label等。 - 数据字段: 描述了每个任务的数据字段,如
sentence,text1,text2,label等。 - 数据分割: 提供了每个任务的数据分割详情,包括训练集、验证集和测试集的大小。
数据集任务详情
- ax: 通过自然语言推理(NLI)问题评估句子理解。
- cola: 评估英语句子是否符合语法。
- mnli: 评估给定前提句和假设句之间的文本蕴涵关系。
- mnli_matched: MNLI的匹配验证和测试分割。
- mnli_mismatched: MNLI的不匹配验证和测试分割。
- mrpc: 评估句子对是否语义等价。
- qnli: 评估给定问题和上下文句子是否包含答案。
- qqp: 评估Quora问题对是否语义等价。
- rte: 评估文本蕴涵关系,结合了多个RTE数据集。
- sst2: 评估电影评论句子的情感倾向。
- stsb: 评估句子对的语义相似度。
- wnli: 评估Winograd模式挑战中的句子蕴涵关系。
数据集语言
- 语言: 英语
以上概述了GLUE数据集的基本信息、结构、任务详情和语言信息,为理解和使用该数据集提供了清晰的指导。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



