five

PAWS-X

收藏
魔搭社区2025-10-15 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/PAWS-X
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: PAWS-X labelTypes: - Chinese Corpus license: - PAWS-X Custom mediaTypes: - Text paperUrl: https://arxiv.org/pdf/1908.11828v1.pdf publishDate: "2019" publishUrl: https://github.com/google-research-datasets/paws publisher: - Google Research tags: - Text taskTypes: - Language Modelling - Paraphrase Identification - Cross Lingual Transfer - Cross Lingual Paraphrase Identification --- # 数据集介绍 ## 简介 PAWS-X 包含 23,659 个人工翻译的 PAWS 评估对和 296,406 个机器翻译的训练对,采用六种类型不同的语言:法语、西班牙语、德语、中文、日语和韩语。所有翻译的对都来自 PAWS-Wiki 中的示例。 ## 引文 ``` @article{yang2019paws, title={PAWS-X: A cross-lingual adversarial dataset for paraphrase identification}, author={Yang, Yinfei and Zhang, Yuan and Tar, Chris and Baldridge, Jason}, journal={arXiv preprint arXiv:1908.11828}, year={2019} } ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:PAWS-X 标签类型: - 中文语料库(Chinese Corpus) 许可协议: - PAWS-X 自定义许可 媒体类型: - 文本(Text) 论文链接:https://arxiv.org/pdf/1908.11828v1.pdf 发布日期:"2019" 发布地址:https://github.com/google-research-datasets/paws 发布方: - 谷歌研究院(Google Research) 标签: - 文本(Text) 任务类型: - 语言建模(Language Modelling) - 释义识别(Paraphrase Identification) - 跨语言迁移(Cross Lingual Transfer) - 跨语言释义识别(Cross Lingual Paraphrase Identification) --- # 数据集介绍 ## 简介 PAWS-X 包含23,659条人工翻译的PAWS评估对与296,406条机器翻译的训练对,覆盖法语、西班牙语、德语、中文、日语及韩语六种语言。所有翻译样本均源自PAWS-Wiki中的示例。 ## 引文 @article{yang2019paws, title={PAWS-X: A cross-lingual adversarial dataset for paraphrase identification}, author={Yang, Yinfei and Zhang, Yuan and Tar, Chris and Baldridge, Jason}, journal={arXiv preprint arXiv:1908.11828}, year={2019} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作