Omartificial-Intelligence-Space/Arabic-Quora-Duplicates
收藏Hugging Face2024-07-03 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Omartificial-Intelligence-Space/Arabic-Quora-Duplicates
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Quora Question Pairs数据集的阿拉伯语版本,包含四种格式,适用于使用Sentence Transformers训练嵌入模型。数据集最初由Quora为Kaggle竞赛创建,可用于训练或微调语义文本相似性的嵌入模型。数据子集包含两列,分别为“anchor”和“positive”,均为字符串类型。
提供机构:
Omartificial-Intelligence-Space
原始信息汇总
Arabic-Quora-Duplicates
数据集概述
- 数据集名称:Arabic-Quora-Duplicates
- 数据集类型:Quora问题对数据集的阿拉伯语版本
- 数据格式:包含四种易于与Sentence Transformers配合使用的格式
- 数据来源:最初由Quora为Kaggle竞赛创建
- 用途:可用于训练/微调嵌入模型以进行语义文本相似度分析
数据子集
- 列名:"anchor", "positive"
- 列类型:str, str
示例
python { "anchor": "كيف أكون جيولوجياً جيداً؟", "positive": "ماذا علي أن أفعل لأكون جيولوجياً عظيماً؟" }
免责声明
请注意,翻译后的句子是使用神经机器翻译生成的,可能不会总是准确传达原意。



