five

Omartificial-Intelligence-Space/Arabic-NLi-Pair-Class

收藏
Hugging Face2024-07-03 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Omartificial-Intelligence-Space/Arabic-NLi-Pair-Class
下载链接
链接失效反馈
官方服务:
资源简介:
Arabic NLI Pair-Class数据集是SNLI和MultiNLI数据集的阿拉伯语版本,主要用于自然语言推理(NLI)。该数据集可以用于训练或微调嵌入模型以进行语义文本相似性分析。数据集的子集包含三个列:premise(前提)、hypothesis(假设)和label(标签),其中label列是一个类别,包含entailment(蕴含)、neutral(中立)和contradiction(矛盾)三个值。文件还提供了阿拉伯语的示例,并指出翻译的句子可能不总是准确传达原意。

The Arabic NLI Pair-Class dataset is the Arabic version of the SNLI and MultiNLI datasets, primarily used for Natural Language Inference (NLI). This dataset can be used for training or fine-tuning an embedding model for semantic textual similarity. The subset of the dataset contains three columns: premise, hypothesis, and label, where the label column is a class with values {entailment, neutral, contradiction}. The file also provides Arabic examples and notes that the translated sentences may not always accurately convey the intended meaning.
提供机构:
Omartificial-Intelligence-Space
原始信息汇总

Arabic NLI Pair-Class

数据集概述

  • 数据集是SNLI和MultiNLI数据集的阿拉伯语版本(Pair-Class子集)。
  • 最初用于自然语言推理(NLI)任务。
  • 可用于训练/微调用于语义文本相似性的嵌入模型。

Pair-Class子集

  • 列:"premise", "hypothesis", "label"
  • 列类型:str, str, class with {"0": "entailment", "1": "neutral", "2": "contradiction"}

阿拉伯语示例

python { "premise": "شخص على حصان يقفز فوق طائرة معطلة", "hypothesis": "شخص يقوم بتدريب حصانه للمنافسة", "label": 1, }, { "premise": "شخص على حصان يقفز فوق طائرة معطلة", "hypothesis": "شخص في مطعم، يطلب عجة.", "label": 2, }, { "premise": "شخص على حصان يقفز فوق طائرة معطلة", "hypothesis": "شخص في الهواء الطلق، على حصان.", "label": 0, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作