Omartificial-Intelligence-Space/Arabic-NLi-Triplet
收藏Hugging Face2024-07-03 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Omartificial-Intelligence-Space/Arabic-NLi-Triplet
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是阿拉伯语版本的SNLI和MultiNLI数据集的三元组子集,主要用于自然语言推理(NLI)。它可用于训练或微调嵌入模型以进行语义文本相似性分析。数据集包含三个列:anchor、positive和negative,每个列的类型都是字符串。示例展示了数据集的结构。需要注意的是,翻译的句子可能不总是准确传达原意。
The dataset is an Arabic version of the SNLI and MultiNLI datasets, specifically the triplet subset. It is primarily used for Natural Language Inference (NLI) and can be utilized for training or fine-tuning an embedding model for semantic textual similarity. The dataset includes three columns: anchor, positive, and negative, all of which are of string type. An example is provided to illustrate the structure of the dataset. It is important to note that the translated sentences may not always accurately convey the intended meaning.
提供机构:
Omartificial-Intelligence-Space
原始信息汇总
Arabic NLI Triplet 数据集概述
数据集总结
- 该数据集是SNLI和MultiNLI数据集的阿拉伯语版本(三元组子集)。
- 最初用于自然语言推理(NLI)任务。
- 该数据集可用于训练/微调嵌入模型,以实现语义文本相似性。
三元组子集
- 列名:"anchor", "positive", "negative"
- 列类型:str, str, str
示例:
python { "anchor": "شخص على حصان يقفز فوق طائرة معطلة", "positive": "شخص في الهواء الطلق، على حصان.", "negative": "شخص في مطعم، يطلب عجة." }



