ukr-detect/ukr-nli-dataset-translated-stanford
收藏Hugging Face2025-02-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ukr-detect/ukr-nli-dataset-translated-stanford
下载链接
链接失效反馈官方服务:
资源简介:
我们通过翻译英语NLI数据,获得了首个乌克兰自然语言推理数据集。数据来源为斯坦福大学的SNLI项目,使用Facebook的NLLB-200-distilled-600M模型进行翻译。标签含义:0 - 蕴含,1 - 中立,2 - 矛盾。
我们通过翻译英语NLI数据,获得了首个乌克兰自然语言推理数据集。数据来源为斯坦福大学的SNLI项目,使用Facebook的NLLB-200-distilled-600M模型进行翻译。标签含义:0 - 蕴含,1 - 中立,2 - 矛盾。
提供机构:
ukr-detect
原始信息汇总
数据集概述
数据集信息
- 特征:
premise: 类型为字符串 (string)hypothesis: 类型为字符串 (string)labels: 类型为整数 (int64)
- 分割:
train: 字节数为 107441017,样本数为 549361validation: 字节数为 2029907,样本数为 9842test: 字节数为 2025559,样本数为 9824
- 下载大小: 27765800 字节
- 数据集大小: 111496483 字节
配置
- 默认配置:
train: 文件路径为data/train-*validation: 文件路径为data/validation-*test: 文件路径为data/test-*
任务类别
- 文本分类 (text-classification)
语言
- 乌克兰语 (uk)
数据集名称
ukr-nli
标签说明
0: 蕴含 (entailment)1: 中性 (neutral)2: 矛盾 (contradiction)
数据集加载
python from datasets import load_dataset dataset = load_dataset("ukr-detect/ukr-nli-dataset-translated-stanford")



