OCNLI
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/OCNLI
下载链接
链接失效反馈官方服务:
资源简介:
OCNLI代表原始中文自然语言推论。它是中文自然语言推理的语料库,紧密按照MNLI的程序收集,但具有增强的策略,旨在实现更具挑战性的推理对。我们想强调的是,我们在创建数据集时没有使用人机翻译,因此我们的中文文本是原创的,没有翻译。
OCNLI stands for Original Chinese Natural Language Inference. It is a corpus for Chinese natural language inference, collected strictly following the procedures of MNLI but with enhanced strategies designed to generate more challenging inference pairs. We wish to emphasize that no machine translation was utilized during the creation of this dataset, and thus all our Chinese texts are original and untranslated.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
OCNLI是一个中文自然语言推理语料库,紧密遵循MNLI程序收集但采用增强策略,旨在提供更具挑战性的推理对,其中文文本为原创而非翻译。该数据集适用于文本预训练、评测、自然语言推理及零样本学习等场景,由艾伦人工智能研究所等机构于2020年发布,主要用于学术研究。
以上内容由遇见数据集搜集并总结生成



