kakaobrain/kor_nli
收藏Hugging Face2024-08-22 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/kakaobrain/kor_nli
下载链接
链接失效反馈官方服务:
资源简介:
KorNLI是一个韩语自然语言推理数据集,包含三个配置:multi_nli、snli和xnli。数据集的任务类别是文本分类,具体任务包括自然语言推理和多输入文本分类。数据集的创建涉及众包和机器生成、专家生成的语言内容。数据集的许可证是CC BY-SA 4.0。
提供机构:
kakaobrain
原始信息汇总
数据集概述
基本信息
- 数据集名称: KorNLI
- 语言: 韩语
- 许可: CC BY-SA 4.0
- 多语言性: 单语种
- 数据集大小: 100K<n<1M
- 任务类别: 文本分类
- 任务ID: 自然语言推理、多输入文本分类
数据集配置
-
multi_nli
- 特征:
premise: 字符串hypothesis: 字符串label: 分类标签,可能值包括entailment(0),neutral(1),contradiction(2)
- 分割:
train: 392702 个样本
- 下载大小: 42113232 字节
- 数据集大小: 84729207 字节
- 特征:
-
snli
- 特征:
premise: 字符串hypothesis: 字符串label: 分类标签,可能值包括entailment(0),neutral(1),contradiction(2)
- 分割:
train: 550152 个样本
- 下载大小: 42113232 字节
- 数据集大小: 80137097 字节
- 特征:
-
xnli
- 特征:
premise: 字符串hypothesis: 字符串label: 分类标签,可能值包括entailment(0),neutral(1),contradiction(2)
- 分割:
validation: 2490 个样本test: 5010 个样本
- 下载大小: 42113232 字节
- 数据集大小: 1566267 字节
- 特征:
数据来源
- 源数据集:
- multi_nli
- snli
- xnli
数据集创建
- 标注创建者: 众包
- 语言创建者: 机器生成、专家生成
许可信息
- 许可: CC BY-SA 4.0
引用信息
@article{ham2020kornli, title={KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding}, author={Ham, Jiyeon and Choe, Yo Joong and Park, Kyubyong and Choi, Ilji and Soh, Hyungjoon}, journal={arXiv preprint arXiv:2004.03289}, year={2020} }



