Omartificial-Intelligence-Space/Arabic-NLi-Pair-Class
收藏Hugging Face2024-07-03 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Omartificial-Intelligence-Space/Arabic-NLi-Pair-Class
下载链接
链接失效反馈官方服务:
资源简介:
Arabic NLI Pair-Class数据集是SNLI和MultiNLI数据集的阿拉伯语版本,主要用于自然语言推理(NLI)。该数据集可以用于训练或微调嵌入模型以进行语义文本相似性分析。数据集的子集包含三个列:premise(前提)、hypothesis(假设)和label(标签),其中label列是一个类别,包含entailment(蕴含)、neutral(中立)和contradiction(矛盾)三个值。文件还提供了阿拉伯语的示例,并指出翻译的句子可能不总是准确传达原意。
The Arabic NLI Pair-Class dataset is the Arabic version of the SNLI and MultiNLI datasets, primarily used for Natural Language Inference (NLI). This dataset can be used for training or fine-tuning an embedding model for semantic textual similarity. The subset of the dataset contains three columns: premise, hypothesis, and label, where the label column is a class with values {entailment, neutral, contradiction}. The file also provides Arabic examples and notes that the translated sentences may not always accurately convey the intended meaning.
提供机构:
Omartificial-Intelligence-Space
原始信息汇总
Arabic NLI Pair-Class
数据集概述
- 数据集是SNLI和MultiNLI数据集的阿拉伯语版本(Pair-Class子集)。
- 最初用于自然语言推理(NLI)任务。
- 可用于训练/微调用于语义文本相似性的嵌入模型。
Pair-Class子集
- 列:"premise", "hypothesis", "label"
- 列类型:str, str, class with {"0": "entailment", "1": "neutral", "2": "contradiction"}
阿拉伯语示例
python { "premise": "شخص على حصان يقفز فوق طائرة معطلة", "hypothesis": "شخص يقوم بتدريب حصانه للمنافسة", "label": 1, }, { "premise": "شخص على حصان يقفز فوق طائرة معطلة", "hypothesis": "شخص في مطعم، يطلب عجة.", "label": 2, }, { "premise": "شخص على حصان يقفز فوق طائرة معطلة", "hypothesis": "شخص في الهواء الطلق، على حصان.", "label": 0, }



