UMCU/SNLI_Dutch_translated_with_Marianmt

Name: UMCU/SNLI_Dutch_translated_with_Marianmt
Creator: UMCU
Published: 2023-11-17 09:58:10
License: 暂无描述

Hugging Face2023-11-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/UMCU/SNLI_Dutch_translated_with_Marianmt

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用Maria NMT模型将英文的Stanford Natural Language Inference (SNLI)语料库翻译成荷兰语的版本。数据集的主要特征包括premise、hypothesis和label，分别表示前提、假设和标签。数据集分为训练集、测试集和验证集，分别包含538896、9792和9792个样本。数据集的许可证为cc-by-sa-4.0，语言为荷兰语，任务类别为句子相似性。

提供机构：

UMCU

原始信息汇总

数据集概述

配置

配置名称: default
数据文件:
- 训练集: data/train-*
- 测试集: data/test-*
- 验证集: data/validation-*

数据集信息

特征:
- 前提: 类型为字符串
- 假设: 类型为字符串
- 标签: 类型为int64
分割:
- 训练集:
  - 字节数: 67523459
  - 样本数: 538896
- 测试集:
  - 字节数: 1285789
  - 样本数: 9792
- 验证集:
  - 字节数: 1295645
  - 样本数: 9792
下载大小: 20806553字节
数据集大小: 70104893字节

许可证

许可证: Creative Commons Attribution-ShareAlike 4.0 International License

语言

语言: 荷兰语

名称

名称: Dutch translation of SNLI corpus with Maria NMT

大小类别

大小类别: 100K<n<1M

任务类别

任务类别: sentence-similarity

5,000+

优质数据集

54 个

任务类型

进入经典数据集