Quora_Question_Pairs
收藏魔搭社区2025-07-22 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Quora_Question_Pairs
下载链接
链接失效反馈官方服务:
资源简介:
displayName: Quora Question Pairs
labelTypes:
- Classification
license:
- Quora Question Pairs Custom
mediaTypes:
- Image
paperUrl: ""
publishDate: "2020"
publishUrl: https://quoradata.quora.com/First-Quora-Dataset-Release-Question-Pairs
publisher:
- Google
- Facebook
- DoorDash
tags:
- Text
taskTypes:
- Text Matching
---
# 数据集介绍
## 简介
目标是预测包含的问题对中的哪些包含具有相同含义的对。基本事实是人类专家提供的一组标签,本质上是主观的,因为每个句子的真正预期含义永远无法完全确定。人工标记也被认为是一个相对“嘈杂”的过程,具有其自身的主观性。因此,数据集中的真实标签应被视为“知情”,但不是 100% 准确。总的来说,这些标签应该理想地代表一种合理的共识。
## 类定义
```
paraphrase/not paraphrase
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:Quora问题对(Quora Question Pairs)
标签类型:
- 分类(Classification)
许可协议:
- Quora问题对专有许可(Quora Question Pairs Custom)
媒体类型:
- 图像(Image)
论文链接:无
发布日期:2020年
发布链接:https://quoradata.quora.com/First-Quora-Dataset-Release-Question-Pairs
发布方:
- 谷歌(Google)
- 脸书(Facebook)
- DoorDash
标签:
- 文本(Text)
任务类型:
- 文本匹配(Text Matching)
---
# 数据集介绍
## 简介
本数据集的目标为预测所包含的问题对中,哪些属于语义等价的问题对。标注基准由人类专家提供,其本质带有主观性——由于任何语句的真实预期含义均无法被完全确定,且人工标注流程本身也属于相对“嘈杂”的过程,带有自身的主观局限性。因此,数据集中的真实标签仅可被视为“经过审慎考量的共识性结果”,而非100%准确。总体而言,这些标签应尽可能代表合理的群体共识。
## 类定义
语义等价(paraphrase)/非语义等价(not paraphrase)
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-04



