GLUE subsets (SST2, QNLI, QQP)
收藏arXiv2025-09-30 收录
下载链接:
https://huggingface.co/datasets/nyu-mll/glue
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从GLUE基准测试中选取的子集,专门用于文本分类任务。GLUE基准测试是一个广泛使用的评估标准,旨在衡量自然语言处理系统的性能,而所选的这些子集则聚焦于文本分类这一具体任务。通过对这些子集的分析和应用,研究人员和开发者可以更准确地评估和改进他们在文本分类领域的模型效果。
This dataset is a subset selected from the GLUE benchmark, which is specifically tailored for text classification tasks. The GLUE benchmark is a widely adopted evaluation standard for measuring the performance of natural language processing (NLP) systems, and the selected subsets focus exclusively on the specific task of text classification. Through analysis and application of these subsets, researchers and developers can more accurately evaluate and improve the performance of their models in the text classification domain.
提供机构:
Hugging Face
搜集汇总
数据集介绍

背景与挑战
背景概述
GLUE(通用语言理解评估基准)是一个综合性自然语言理解数据集集合,包含12个子任务,涵盖文本分类、自然语言推理和语义相似性评分等多种任务。数据集规模在100万到1000万行之间,使用英语文本,旨在为自然语言理解系统的训练、评估和分析提供标准化资源。
以上内容由遇见数据集搜集并总结生成



