five

MRPC Dataset

收藏
paperswithcode.com2025-03-27 收录
下载链接:
https://paperswithcode.com/dataset/mrpc
下载链接
链接失效反馈
官方服务:
资源简介:
Microsoft Research Paraphrase Corpus (MRPC) is a corpus consists of 5,801 sentence pairs collected from newswire articles. Each pair is labelled if it is a paraphrase or not by human annotators. The whole set is divided into a training subset (4,076 sentence pairs of which 2,753 are paraphrases) and a test subset (1,725 pairs of which 1,147 are paraphrases).

微软研究院释义语料库(MRPC)系由5,801句对组成,这些句对源自新闻稿件。每一句对均由人工标注员标记为是否为释义。整个语料库被划分为训练子集(其中包含4,076句对,其中2,753句对为释义)和测试子集(其中包含1,725句对,其中1,147句对为释义)。
提供机构:
paperswithcode.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作