five

nflechas/semantic_sentence_similarity_ES

收藏
Hugging Face2023-03-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nflechas/semantic_sentence_similarity_ES
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集基于PlanTL-GOB-ES/sts-es数据集,包含了SemEval 2014、2015和2017年共享任务中的句子相似度数据。数据集包含两个句子(sentence1和sentence2)以及它们的相似度标签(label)。数据集分为训练集、验证集和测试集,分别包含1411、168和245个样本。数据集的总下载大小为427004字节,总大小为661241字节。

--- 数据集信息: 特征: - 名称:sentence1 数据类型:字符串(string) - 名称:sentence2 数据类型:字符串(string) - 名称:label 数据类型:64位浮点数(float64) 数据集划分: - 名称:训练集(train) 字节数:547540 样本数量:1411 - 名称:验证集(validation) 字节数:40604 样本数量:168 - 名称:测试集(test) 字节数:73097 样本数量:245 下载大小:427004 数据集总大小:661241 --- # "语义句子相似度(semantic sentence similarity)西班牙语版"数据集卡片 本数据集基于https://huggingface.co/datasets/PlanTL-GOB-ES/sts-es构建,该源数据集包含了语义评测研讨会(SemEval)2014与2015年度句子相似度共享任务所使用的数据集,相关引用信息可访问该链接获取详情;此外本数据集还补充了SemEval 2017的相关数据。
提供机构:
nflechas
原始信息汇总

数据集概述

数据集名称

semantic_sentence_similarity_ES

数据集特征

  • sentence1: 数据类型为字符串。
  • sentence2: 数据类型为字符串。
  • label: 数据类型为float64。

数据集划分

  • 训练集 (train): 包含1411个样本,总大小为547540字节。
  • 验证集 (validation): 包含168个样本,总大小为40604字节。
  • 测试集 (test): 包含245个样本,总大小为73097字节。

数据集大小

  • 下载大小: 427004字节。
  • 数据集总大小: 661241字节。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作