nflechas/semantic_sentence_similarity_ES

Name: nflechas/semantic_sentence_similarity_ES
Creator: nflechas
Published: 2023-03-21 21:57:25
License: 暂无描述

Hugging Face2023-03-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/nflechas/semantic_sentence_similarity_ES

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集基于PlanTL-GOB-ES/sts-es数据集，包含了SemEval 2014、2015和2017年共享任务中的句子相似度数据。数据集包含两个句子（sentence1和sentence2）以及它们的相似度标签（label）。数据集分为训练集、验证集和测试集，分别包含1411、168和245个样本。数据集的总下载大小为427004字节，总大小为661241字节。

--- 数据集信息：特征： - 名称：sentence1 数据类型：字符串（string） - 名称：sentence2 数据类型：字符串（string） - 名称：label 数据类型：64位浮点数（float64）数据集划分： - 名称：训练集（train）字节数：547540 样本数量：1411 - 名称：验证集（validation）字节数：40604 样本数量：168 - 名称：测试集（test）字节数：73097 样本数量：245 下载大小：427004 数据集总大小：661241 --- # "语义句子相似度（semantic sentence similarity）西班牙语版"数据集卡片本数据集基于https://huggingface.co/datasets/PlanTL-GOB-ES/sts-es构建，该源数据集包含了语义评测研讨会（SemEval）2014与2015年度句子相似度共享任务所使用的数据集，相关引用信息可访问该链接获取详情；此外本数据集还补充了SemEval 2017的相关数据。

提供机构：

nflechas

原始信息汇总

数据集概述

数据集名称

semantic_sentence_similarity_ES

数据集特征

sentence1: 数据类型为字符串。
sentence2: 数据类型为字符串。
label: 数据类型为float64。

数据集划分

训练集 (train): 包含1411个样本，总大小为547540字节。
验证集 (validation): 包含168个样本，总大小为40604字节。
测试集 (test): 包含245个样本，总大小为73097字节。

数据集大小

下载大小: 427004字节。
数据集总大小: 661241字节。

5,000+

优质数据集

54 个

任务类型

进入经典数据集