rish16/MLe-SNLI
收藏Hugging Face2023-04-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rish16/MLe-SNLI
下载链接
链接失效反馈官方服务:
资源简介:
MLe-SNLI数据集包含50万条训练样本,每条样本包括前提、假设、标签和解释,并且这些样本被翻译成西班牙语、德语、荷兰语和法语。测试集和验证集各有49120条样本,同样被翻译成上述四种语言。数据集中的每一列都有明确的描述,包括前提、假设、标签、解释和语言。
MLe-SNLI数据集包含50万条训练样本,每条样本包括前提、假设、标签和解释,并且这些样本被翻译成西班牙语、德语、荷兰语和法语。测试集和验证集各有49120条样本,同样被翻译成上述四种语言。数据集中的每一列都有明确的描述,包括前提、假设、标签、解释和语言。
提供机构:
rish16
原始信息汇总
Multilingual e-SNLI (MLe-SNLI) 数据集概述
数据集描述
- MLe-SNLI 是一个包含多语言的训练、验证和测试集的数据集。
- 训练集包含500,000个样本,每个样本包含前提句、假设句、标签和解释。
- 验证集和测试集各包含49,120个样本,每个样本同样包含前提句、假设句、标签和解释。
- 数据集中的语言包括英语、西班牙语、德语、荷兰语和法语。
数据集结构
| 列名 | 描述 |
|---|---|
premise |
自然语言前提句 |
hypothesis |
自然语言假设句 |
label |
标签,包括entailment, contradiction, neutral |
explanation_1 |
对label的自然语言解释 |
language |
语言,包括en, es, de, nl, fr |
下载和使用
-
数据集可通过HuggingFace Datasets API加载。
-
示例代码如下: python from datasets import load_dataset
mle_snli = load_dataset("rish16/MLe-SNLI")
train_data = mle_snli[train] dev_data = mle_snli[dev] test_data = mle_snli[test]
print (mle_snli)
注意事项
- 数据集的翻译质量可能因原始e-SNLI数据集的质量问题而受影响,使用时需谨慎。



