ncats/EpiSet4BinaryClassification
收藏Hugging Face2024-09-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ncats/EpiSet4BinaryClassification
下载链接
链接失效反馈官方服务:
资源简介:
GLUE(通用语言理解评估基准)是一个用于训练、评估和分析自然语言理解系统的资源集合。数据集包含多个任务,如语言可接受性判断等。数据集的规模在10K到100K之间,语言为英语,许可证为CC-BY-4.0。
提供机构:
ncats
原始信息汇总
数据集概述
- 名称: GLUE (General Language Understanding Evaluation benchmark)
- 语言: 英语 (en)
- 许可证: CC-BY-4.0
- 多语言性: 单语种
- 大小: 10K<n<100K
数据集描述
- 摘要: GLUE是一个用于训练、评估和分析自然语言理解系统的资源集合。
- 支持的任务和排行榜: GLUE基准的排行榜包括以下任务:
- cola: 英语语法可接受性判断,每个示例是一个单词序列,标注为是否为合法的英语句子。
数据集结构
-
数据实例: 以train数据集为例,包含以下字段:
sentence: 字符串类型,句子内容。label: 分类标签,可能值为unacceptable(0) 和acceptable(1)。id: 整数类型,标识符。
-
数据字段: 所有分割的数据字段相同,包括:
abstract: 字符串类型。label: 分类标签,可能值为unacceptable(0) 和acceptable(1)。idx: 整数类型。
-
数据分割:
分割 数量 train 8551 validation 1043 test 1063
数据集创建
- 注释者: 来自National Institutes of Health (NIH) Genetic and Rare Diseases Information Center (GARD)的罕见疾病策展人。
许可证信息
- 许可证: CC-BY-4.0
贡献者
- 感谢@patpizio, @jeswan, @thomwolf, @patrickvonplaten, @mariamabarham为该数据集的添加做出的贡献。



