five

PARANMT-50M

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/PARANMT-50M
下载链接
链接失效反馈
官方服务:
资源简介:
我们描述了 PARANMT-50M,这是一个包含超过 5000 万个英语-英语句子释义对的数据集。在 Wieting 等人之后,我们通过使用神经机器翻译来翻译大型平行语料库的非英语部分来自动生成对。 (2017)。我们希望 ParaNMT-50M 可以成为释义生成的宝贵资源,并可以提供丰富的语义知识来源,以改善下游自然语言理解任务。为了展示它的实用性,我们使用 ParaNMT-50M 来训练在每个 SemEval 语义文本相似度竞争中优于所有监督系统的释义句子嵌入,此外还展示了它如何用于释义生成。
提供机构:
OpenDataLab
创建时间:
2022-06-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作