nflechas/semantic_sentence_similarity_ES
收藏Hugging Face2023-03-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nflechas/semantic_sentence_similarity_ES
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于PlanTL-GOB-ES/sts-es数据集,包含了SemEval 2014、2015和2017年共享任务中的句子相似度数据。数据集包含两个句子(sentence1和sentence2)以及它们的相似度标签(label)。数据集分为训练集、验证集和测试集,分别包含1411、168和245个样本。数据集的总下载大小为427004字节,总大小为661241字节。
---
数据集信息:
特征:
- 名称:sentence1
数据类型:字符串(string)
- 名称:sentence2
数据类型:字符串(string)
- 名称:label
数据类型:64位浮点数(float64)
数据集划分:
- 名称:训练集(train)
字节数:547540
样本数量:1411
- 名称:验证集(validation)
字节数:40604
样本数量:168
- 名称:测试集(test)
字节数:73097
样本数量:245
下载大小:427004
数据集总大小:661241
---
# "语义句子相似度(semantic sentence similarity)西班牙语版"数据集卡片
本数据集基于https://huggingface.co/datasets/PlanTL-GOB-ES/sts-es构建,该源数据集包含了语义评测研讨会(SemEval)2014与2015年度句子相似度共享任务所使用的数据集,相关引用信息可访问该链接获取详情;此外本数据集还补充了SemEval 2017的相关数据。
提供机构:
nflechas
原始信息汇总
数据集概述
数据集名称
semantic_sentence_similarity_ES
数据集特征
- sentence1: 数据类型为字符串。
- sentence2: 数据类型为字符串。
- label: 数据类型为float64。
数据集划分
- 训练集 (train): 包含1411个样本,总大小为547540字节。
- 验证集 (validation): 包含168个样本,总大小为40604字节。
- 测试集 (test): 包含245个样本,总大小为73097字节。
数据集大小
- 下载大小: 427004字节。
- 数据集总大小: 661241字节。



