five

Quora_Question_Pairs

收藏
魔搭社区2025-07-22 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Quora_Question_Pairs
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: Quora Question Pairs labelTypes: - Classification license: - Quora Question Pairs Custom mediaTypes: - Image paperUrl: "" publishDate: "2020" publishUrl: https://quoradata.quora.com/First-Quora-Dataset-Release-Question-Pairs publisher: - Google - Facebook - DoorDash tags: - Text taskTypes: - Text Matching --- # 数据集介绍 ## 简介 目标是预测包含的问题对中的哪些包含具有相同含义的对。基本事实是人类专家提供的一组标签,本质上是主观的,因为每个句子的真正预期含义永远无法完全确定。人工标记也被认为是一个相对“嘈杂”的过程,具有其自身的主观性。因此,数据集中的真实标签应被视为“知情”,但不是 100% 准确。总的来说,这些标签应该理想地代表一种合理的共识。 ## 类定义 ``` paraphrase/not paraphrase ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:Quora问题对(Quora Question Pairs) 标签类型: - 分类(Classification) 许可协议: - Quora问题对专有许可(Quora Question Pairs Custom) 媒体类型: - 图像(Image) 论文链接:无 发布日期:2020年 发布链接:https://quoradata.quora.com/First-Quora-Dataset-Release-Question-Pairs 发布方: - 谷歌(Google) - 脸书(Facebook) - DoorDash 标签: - 文本(Text) 任务类型: - 文本匹配(Text Matching) --- # 数据集介绍 ## 简介 本数据集的目标为预测所包含的问题对中,哪些属于语义等价的问题对。标注基准由人类专家提供,其本质带有主观性——由于任何语句的真实预期含义均无法被完全确定,且人工标注流程本身也属于相对“嘈杂”的过程,带有自身的主观局限性。因此,数据集中的真实标签仅可被视为“经过审慎考量的共识性结果”,而非100%准确。总体而言,这些标签应尽可能代表合理的群体共识。 ## 类定义 语义等价(paraphrase)/非语义等价(not paraphrase) ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-04
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作