severo/glue

收藏

Hugging Face2022-10-28 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/severo/glue

下载链接

链接失效反馈

官方服务：

资源简介：

GLUE（通用语言理解评估基准）是一个用于训练、评估和分析自然语言理解系统的资源集合。它包括多个任务，如文本分类、自然语言推理和语义相似性评分。数据集是单语言的（英语），并且属于文本分类任务类别。它包括多个配置和任务的分割，每个任务都有特定的数据字段和示例。

提供机构：

severo

原始信息汇总

数据集概述

数据集名称

GLUE (General Language Understanding Evaluation benchmark)

数据集基本信息

语言: 英语 (en)
许可证: CC-BY-4.0
多语言性: 单语种
大小类别: 10K<n<100K
源数据集: 原始数据
任务类别: 文本分类
任务ID:
- acceptability-classification
- natural-language-inference
- semantic-similarity-scoring
- sentiment-classification
- text-scoring

数据集结构

数据实例: 详细描述了每个任务的数据实例结构，包括字段如premise, hypothesis, label等。
数据字段: 描述了每个任务的数据字段，如sentence, text1, text2, label等。
数据分割: 提供了每个任务的数据分割详情，包括训练集、验证集和测试集的大小。

数据集任务详情

ax: 通过自然语言推理（NLI）问题评估句子理解。
cola: 评估英语句子是否符合语法。
mnli: 评估给定前提句和假设句之间的文本蕴涵关系。
mnli_matched: MNLI的匹配验证和测试分割。
mnli_mismatched: MNLI的不匹配验证和测试分割。
mrpc: 评估句子对是否语义等价。
qnli: 评估给定问题和上下文句子是否包含答案。
qqp: 评估Quora问题对是否语义等价。
rte: 评估文本蕴涵关系，结合了多个RTE数据集。
sst2: 评估电影评论句子的情感倾向。
stsb: 评估句子对的语义相似度。
wnli: 评估Winograd模式挑战中的句子蕴涵关系。

数据集语言

语言: 英语

以上概述了GLUE数据集的基本信息、结构、任务详情和语言信息，为理解和使用该数据集提供了清晰的指导。

搜集汇总

数据集介绍

main_image_url

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

© 2023-2025 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

面向社区/商业的数据集话题

二维码

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作