sartifyllc/Swahili-NLi-Pair_SWH_ENG
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/sartifyllc/Swahili-NLi-Pair_SWH_ENG
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三种语言相关的特征:language、anchor和positive。数据集被分为训练集(train)、开发集(dev)和测试集(test)三个部分,分别包含628630、13616和13662个样本。总下载大小为57632750字节,数据集总大小为98570983字节。
该数据集包含三种语言相关的特征:language、anchor和positive。数据集被分为训练集(train)、开发集(dev)和测试集(test)三个部分,分别包含628630、13616和13662个样本。总下载大小为57632750字节,数据集总大小为98570983字节。
提供机构:
sartifyllc
原始信息汇总
数据集概述
特征
- language: 数据类型为字符串。
- anchor: 数据类型为字符串。
- positive: 数据类型为字符串。
数据分割
- train: 包含628630个样本,占用94153117字节。
- dev: 包含13616个样本,占用2166335字节。
- test: 包含13662个样本,占用2251531字节。
数据集大小
- 下载大小: 57632750字节。
- 总数据集大小: 98570983字节。
配置
- config_name: default
- data_files:
- train: 路径为
data/train-*。 - dev: 路径为
data/dev-*。 - test: 路径为
data/test-*。
- train: 路径为
- data_files:



