five

Omartificial-Intelligence-Space/Arabic-Quora-Duplicates

收藏
Hugging Face2024-07-03 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Omartificial-Intelligence-Space/Arabic-Quora-Duplicates
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Quora Question Pairs数据集的阿拉伯语版本,包含四种格式,适用于使用Sentence Transformers训练嵌入模型。数据集最初由Quora为Kaggle竞赛创建,可用于训练或微调语义文本相似性的嵌入模型。数据子集包含两列,分别为“anchor”和“positive”,均为字符串类型。
提供机构:
Omartificial-Intelligence-Space
原始信息汇总

Arabic-Quora-Duplicates

数据集概述

  1. 数据集名称:Arabic-Quora-Duplicates
  2. 数据集类型:Quora问题对数据集的阿拉伯语版本
  3. 数据格式:包含四种易于与Sentence Transformers配合使用的格式
  4. 数据来源:最初由Quora为Kaggle竞赛创建
  5. 用途:可用于训练/微调嵌入模型以进行语义文本相似度分析

数据子集

  • 列名:"anchor", "positive"
  • 列类型:str, str

示例

python { "anchor": "كيف أكون جيولوجياً جيداً؟", "positive": "ماذا علي أن أفعل لأكون جيولوجياً عظيماً؟" }

免责声明

请注意,翻译后的句子是使用神经机器翻译生成的,可能不会总是准确传达原意。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作