Quora Duplicate Questions 文本分类研究数据集
收藏超神经2023-09-11 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/5672
下载链接
链接失效反馈官方服务:
资源简介:
Quora Duplicate Questions Dataset 是用于判别文本中问题对是否重复的数据集,其被用于文本分类研究,旨在为任何人提供训练和测试语义等效模型的机会。
The Quora Duplicate Questions Dataset is a dataset dedicated to detecting whether pairs of questions in text are duplicates. It is employed in text classification research, with the objective of providing anyone with the chance to train and test semantic equivalence models.
创建时间:
2023-04-17
搜集汇总
数据集介绍

背景与挑战
背景概述
Quora Duplicate Questions数据集是一个用于文本分类研究的资源,旨在训练和测试语义等效模型。它包含超过40万行潜在重复问题对,每行提供问题ID、完整文本和重复标签,由Quora团队于2017年发布。
以上内容由遇见数据集搜集并总结生成



