five

ncats/EpiSet4BinaryClassification

收藏
Hugging Face2024-09-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ncats/EpiSet4BinaryClassification
下载链接
链接失效反馈
官方服务:
资源简介:
GLUE(通用语言理解评估基准)是一个用于训练、评估和分析自然语言理解系统的资源集合。数据集包含多个任务,如语言可接受性判断等。数据集的规模在10K到100K之间,语言为英语,许可证为CC-BY-4.0。
提供机构:
ncats
原始信息汇总

数据集概述

  • 名称: GLUE (General Language Understanding Evaluation benchmark)
  • 语言: 英语 (en)
  • 许可证: CC-BY-4.0
  • 多语言性: 单语种
  • 大小: 10K<n<100K

数据集描述

  • 摘要: GLUE是一个用于训练、评估和分析自然语言理解系统的资源集合。
  • 支持的任务和排行榜: GLUE基准的排行榜包括以下任务:
    • cola: 英语语法可接受性判断,每个示例是一个单词序列,标注为是否为合法的英语句子。

数据集结构

  • 数据实例: 以train数据集为例,包含以下字段:

    • sentence: 字符串类型,句子内容。
    • label: 分类标签,可能值为unacceptable (0) 和 acceptable (1)。
    • id: 整数类型,标识符。
  • 数据字段: 所有分割的数据字段相同,包括:

    • abstract: 字符串类型。
    • label: 分类标签,可能值为unacceptable (0) 和 acceptable (1)。
    • idx: 整数类型。
  • 数据分割:

    分割 数量
    train 8551
    validation 1043
    test 1063

数据集创建

许可证信息

  • 许可证: CC-BY-4.0

贡献者

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作