ukr-detect/ukr-nli-dataset-translated-stanford

Name: ukr-detect/ukr-nli-dataset-translated-stanford
Creator: ukr-detect
Published: 2025-02-03 19:39:30
License: 暂无描述

Hugging Face2025-02-03 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ukr-detect/ukr-nli-dataset-translated-stanford

下载链接

链接失效反馈

官方服务：

资源简介：

我们通过翻译英语NLI数据，获得了首个乌克兰自然语言推理数据集。数据来源为斯坦福大学的SNLI项目，使用Facebook的NLLB-200-distilled-600M模型进行翻译。标签含义：0 - 蕴含，1 - 中立，2 - 矛盾。

提供机构：

ukr-detect

原始信息汇总

数据集概述

特征:
- premise: 类型为字符串 (string)
- hypothesis: 类型为字符串 (string)
- labels: 类型为整数 (int64)
分割:
- train: 字节数为 107441017，样本数为 549361
- validation: 字节数为 2029907，样本数为 9842
- test: 字节数为 2025559，样本数为 9824
下载大小: 27765800 字节
数据集大小: 111496483 字节

默认配置:
- train: 文件路径为 data/train-*
- validation: 文件路径为 data/validation-*
- test: 文件路径为 data/test-*

python from datasets import load_dataset dataset = load_dataset("ukr-detect/ukr-nli-dataset-translated-stanford")

5,000+

优质数据集

54 个

任务类型

进入经典数据集