Mollel/Swahili-NLi-Pair_SWH_ENG
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Mollel/Swahili-NLi-Pair_SWH_ENG
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:language(语言)、anchor(锚点)和positive(正面样本)。数据集分为训练集、开发集和测试集三个部分,分别包含628630、13616和13662个样本。数据集的下载大小为57632750字节,总大小为98570983字节。
The dataset contains three main features: language, anchor, and positive. It is divided into three parts: train, dev, and test sets, containing 628630, 13616, and 13662 samples respectively. The download size of the dataset is 57632750 bytes, and the total size is 98570983 bytes.
提供机构:
Mollel
原始信息汇总
数据集概述
数据特征
- language: 数据类型为字符串(string)
- anchor: 数据类型为字符串(string)
- positive: 数据类型为字符串(string)
数据分割
- train:
- 字节数: 94153117
- 样本数: 628630
- dev:
- 字节数: 2166335
- 样本数: 13616
- test:
- 字节数: 2251531
- 样本数: 13662
数据集大小
- 下载大小: 57632750 字节
- 数据集总大小: 98570983 字节
配置
- config_name: default
- 数据文件路径:
- train: data/train-*
- dev: data/dev-*
- test: data/test-*
- 数据文件路径:



