Quora_Question_Pairs

Name: Quora_Question_Pairs
Creator: maas
Published: 2025-07-22 14:30:14
License: 暂无描述

魔搭社区2025-07-22 更新2024-08-31 收录

下载链接：

https://modelscope.cn/datasets/OmniData/Quora_Question_Pairs

下载链接

链接失效反馈

官方服务：

资源简介：

displayName: Quora Question Pairs labelTypes: - Classification license: - Quora Question Pairs Custom mediaTypes: - Image paperUrl: "" publishDate: "2020" publishUrl: https://quoradata.quora.com/First-Quora-Dataset-Release-Question-Pairs publisher: - Google - Facebook - DoorDash tags: - Text taskTypes: - Text Matching --- # 数据集介绍 ## 简介目标是预测包含的问题对中的哪些包含具有相同含义的对。基本事实是人类专家提供的一组标签，本质上是主观的，因为每个句子的真正预期含义永远无法完全确定。人工标记也被认为是一个相对“嘈杂”的过程，具有其自身的主观性。因此，数据集中的真实标签应被视为“知情”，但不是 100% 准确。总的来说，这些标签应该理想地代表一种合理的共识。 ## 类定义 ``` paraphrase/not paraphrase ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称：Quora问题对（Quora Question Pairs）标签类型： - 分类（Classification）许可协议： - Quora问题对专有许可（Quora Question Pairs Custom）媒体类型： - 图像（Image）论文链接：无发布日期：2020年发布链接：https://quoradata.quora.com/First-Quora-Dataset-Release-Question-Pairs 发布方： - 谷歌（Google） - 脸书（Facebook） - DoorDash 标签： - 文本（Text）任务类型： - 文本匹配（Text Matching） --- # 数据集介绍 ## 简介本数据集的目标为预测所包含的问题对中，哪些属于语义等价的问题对。标注基准由人类专家提供，其本质带有主观性——由于任何语句的真实预期含义均无法被完全确定，且人工标注流程本身也属于相对“嘈杂”的过程，带有自身的主观局限性。因此，数据集中的真实标签仅可被视为“经过审慎考量的共识性结果”，而非100%准确。总体而言，这些标签应尽可能代表合理的群体共识。 ## 类定义语义等价（paraphrase）/非语义等价（not paraphrase） ## 数据集下载 :modelscope-code[]{type="git"}

提供机构：

maas

创建时间：

2024-07-04

5,000+

优质数据集

54 个

任务类型

进入经典数据集