gart-labor/eclassTrainST
收藏Hugging Face2023-01-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gart-labor/eclassTrainST
下载链接
链接失效反馈官方服务:
资源简介:
该NLI数据集可用于微调句子相似性任务的模型。它包含来自ECLASS标准的泵属性名称和描述。
数据集信息:
字段特征:
- 字段名:text,数据类型:字符串(string)
- 字段名:蕴含(entailment),数据类型:字符串(string)
- 字段名:矛盾(contradiction),数据类型:字符串(string)
- 字段名:标签(label),数据类型:字符串(string)
划分集:
- 划分名称:train(训练集),字节占用:327174992,样本数量:698880
- 划分名称:eval(验证集),字节占用:219201779,样本数量:450912
下载大小:46751846 字节,数据集总大小:546376771 字节
任务类别:句子相似度(sentence-similarity)
语言:英语(en)
样本规模:100K < n < 1M
# 「eclassTrainST」数据集卡片
本自然语言推理(Natural Language Inference, NLI)数据集可用于针对句子相似度任务的模型微调。其数据源自ECLASS标准中泵类属性的名称与描述文本。
提供机构:
gart-labor
原始信息汇总
数据集概述
数据集名称
- eclassTrainST
数据集特征
- text: 数据类型为字符串
- entailment: 数据类型为字符串
- contradiction: 数据类型为字符串
- label: 数据类型为字符串
数据集分割
- train: 包含698880个样本,总大小为327174992字节
- eval: 包含450912个样本,总大小为219201779字节
数据集大小
- 下载大小: 46751846字节
- 数据集总大小: 546376771字节
任务类别
- sentence-similarity
语言
- en
大小类别
- 100K<n<1M



