Mollel/Swahili-stsb
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Mollel/Swahili-stsb
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个语言的句子对(sentence1和sentence2),每个句子对都有一个分数(score),用于表示这两个句子之间的某种关系或相似度。数据集分为训练集、验证集和测试集,分别包含5749、1500和1379个示例。
该数据集包含多个语言的句子对(sentence1和sentence2),每个句子对都有一个分数(score),用于表示这两个句子之间的某种关系或相似度。数据集分为训练集、验证集和测试集,分别包含5749、1500和1379个示例。
提供机构:
Mollel
原始信息汇总
数据集概述
数据特征
- language: 数据类型为字符串。
- sentence1: 数据类型为字符串。
- sentence2: 数据类型为字符串。
- score: 数据类型为浮点数(float64)。
数据划分
- train: 包含5749个样本,占用851784.5字节。
- validation: 包含1500个样本,占用237699.0字节。
- test: 包含1379个样本,占用189568.0字节。
数据集大小
- 下载大小: 736476字节。
- 总数据集大小: 1279051.5字节。
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-*。 - validation: 路径为
data/validation-*。 - test: 路径为
data/test-*。
- train: 路径为
- data_files:



