five

severo/glue

收藏
Hugging Face2022-10-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/severo/glue
下载链接
链接失效反馈
官方服务:
资源简介:
GLUE(通用语言理解评估基准)是一个用于训练、评估和分析自然语言理解系统的资源集合。它包括多个任务,如文本分类、自然语言推理和语义相似性评分。数据集是单语言的(英语),并且属于文本分类任务类别。它包括多个配置和任务的分割,每个任务都有特定的数据字段和示例。
提供机构:
severo
原始信息汇总

数据集概述

数据集名称

GLUE (General Language Understanding Evaluation benchmark)

数据集基本信息

  • 语言: 英语 (en)
  • 许可证: CC-BY-4.0
  • 多语言性: 单语种
  • 大小类别: 10K<n<100K
  • 源数据集: 原始数据
  • 任务类别: 文本分类
  • 任务ID:
    • acceptability-classification
    • natural-language-inference
    • semantic-similarity-scoring
    • sentiment-classification
    • text-scoring

数据集结构

  • 数据实例: 详细描述了每个任务的数据实例结构,包括字段如premise, hypothesis, label等。
  • 数据字段: 描述了每个任务的数据字段,如sentence, text1, text2, label等。
  • 数据分割: 提供了每个任务的数据分割详情,包括训练集、验证集和测试集的大小。

数据集任务详情

  • ax: 通过自然语言推理(NLI)问题评估句子理解。
  • cola: 评估英语句子是否符合语法。
  • mnli: 评估给定前提句和假设句之间的文本蕴涵关系。
  • mnli_matched: MNLI的匹配验证和测试分割。
  • mnli_mismatched: MNLI的不匹配验证和测试分割。
  • mrpc: 评估句子对是否语义等价。
  • qnli: 评估给定问题和上下文句子是否包含答案。
  • qqp: 评估Quora问题对是否语义等价。
  • rte: 评估文本蕴涵关系,结合了多个RTE数据集。
  • sst2: 评估电影评论句子的情感倾向。
  • stsb: 评估句子对的语义相似度。
  • wnli: 评估Winograd模式挑战中的句子蕴涵关系。

数据集语言

  • 语言: 英语

以上概述了GLUE数据集的基本信息、结构、任务详情和语言信息,为理解和使用该数据集提供了清晰的指导。

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作