PAWS-X
收藏魔搭社区2025-10-15 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/PAWS-X
下载链接
链接失效反馈官方服务:
资源简介:
displayName: PAWS-X
labelTypes:
- Chinese Corpus
license:
- PAWS-X Custom
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/1908.11828v1.pdf
publishDate: "2019"
publishUrl: https://github.com/google-research-datasets/paws
publisher:
- Google Research
tags:
- Text
taskTypes:
- Language Modelling
- Paraphrase Identification
- Cross Lingual Transfer
- Cross Lingual Paraphrase Identification
---
# 数据集介绍
## 简介
PAWS-X 包含 23,659 个人工翻译的 PAWS 评估对和 296,406 个机器翻译的训练对,采用六种类型不同的语言:法语、西班牙语、德语、中文、日语和韩语。所有翻译的对都来自 PAWS-Wiki 中的示例。
## 引文
```
@article{yang2019paws,
title={PAWS-X: A cross-lingual adversarial dataset for paraphrase identification},
author={Yang, Yinfei and Zhang, Yuan and Tar, Chris and Baldridge, Jason},
journal={arXiv preprint arXiv:1908.11828},
year={2019}
}
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:PAWS-X
标签类型:
- 中文语料库(Chinese Corpus)
许可协议:
- PAWS-X 自定义许可
媒体类型:
- 文本(Text)
论文链接:https://arxiv.org/pdf/1908.11828v1.pdf
发布日期:"2019"
发布地址:https://github.com/google-research-datasets/paws
发布方:
- 谷歌研究院(Google Research)
标签:
- 文本(Text)
任务类型:
- 语言建模(Language Modelling)
- 释义识别(Paraphrase Identification)
- 跨语言迁移(Cross Lingual Transfer)
- 跨语言释义识别(Cross Lingual Paraphrase Identification)
---
# 数据集介绍
## 简介
PAWS-X 包含23,659条人工翻译的PAWS评估对与296,406条机器翻译的训练对,覆盖法语、西班牙语、德语、中文、日语及韩语六种语言。所有翻译样本均源自PAWS-Wiki中的示例。
## 引文
@article{yang2019paws,
title={PAWS-X: A cross-lingual adversarial dataset for paraphrase identification},
author={Yang, Yinfei and Zhang, Yuan and Tar, Chris and Baldridge, Jason},
journal={arXiv preprint arXiv:1908.11828},
year={2019}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02



