gart-labor/eclassTrainST

Name: gart-labor/eclassTrainST
Creator: gart-labor
Published: 2023-01-07 12:19:59
License: 暂无描述

Hugging Face2023-01-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/gart-labor/eclassTrainST

下载链接

链接失效反馈

官方服务：

资源简介：

该NLI数据集可用于微调句子相似性任务的模型。它包含来自ECLASS标准的泵属性名称和描述。

数据集信息：字段特征： - 字段名：text，数据类型：字符串（string） - 字段名：蕴含（entailment），数据类型：字符串（string） - 字段名：矛盾（contradiction），数据类型：字符串（string） - 字段名：标签（label），数据类型：字符串（string）划分集： - 划分名称：train（训练集），字节占用：327174992，样本数量：698880 - 划分名称：eval（验证集），字节占用：219201779，样本数量：450912 下载大小：46751846 字节，数据集总大小：546376771 字节任务类别：句子相似度（sentence-similarity）语言：英语（en）样本规模：100K < n < 1M # 「eclassTrainST」数据集卡片本自然语言推理（Natural Language Inference, NLI）数据集可用于针对句子相似度任务的模型微调。其数据源自ECLASS标准中泵类属性的名称与描述文本。

提供机构：

gart-labor

原始信息汇总

数据集概述

数据集名称

eclassTrainST

数据集特征

text: 数据类型为字符串
entailment: 数据类型为字符串
contradiction: 数据类型为字符串
label: 数据类型为字符串

数据集分割

train: 包含698880个样本，总大小为327174992字节
eval: 包含450912个样本，总大小为219201779字节

数据集大小

下载大小: 46751846字节
数据集总大小: 546376771字节

任务类别

sentence-similarity

语言

大小类别

100K<n<1M

5,000+

优质数据集

54 个

任务类型

进入经典数据集