PORTULAN/glue-ptpt
收藏Hugging Face2023-05-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PORTULAN/glue-ptpt
下载链接
链接失效反馈官方服务:
资源简介:
GLUE-PTPT数据集是通用语言理解评估基准(GLUE)的欧洲葡萄牙语翻译版本,用于评估Albertina PT-*模型。该数据集由机器生成,包含10K到100K之间的数据量。目前,只有四个任务(MRPC、RTE、STS-B、WNLI)被翻译成欧洲葡萄牙语,其余任务将在未来添加。
GLUE-PTPT数据集是通用语言理解评估基准(GLUE)的欧洲葡萄牙语翻译版本,用于评估Albertina PT-*模型。该数据集由机器生成,包含10K到100K之间的数据量。目前,只有四个任务(MRPC、RTE、STS-B、WNLI)被翻译成欧洲葡萄牙语,其余任务将在未来添加。
提供机构:
PORTULAN
原始信息汇总
GLUE-PTPT 数据集概述
基本信息
- 语言: 欧洲葡萄牙语 (pt)
- 语言创建者: 机器生成
- 来源数据集: GLUE
- 数据集大小: 10,000 < n < 100,000
数据集描述
- 名称: GLUE-PTPT
- 目的: 作为评估 Albertina PT-* 模型的基准,该模型是针对欧洲葡萄牙语的通用语言理解评估。
包含任务
- MRPC
- RTE
- STS-B
- WNLI
引用信息
若使用此数据集,请引用以下文献:
@misc{rodrigues2023advancing, title={Advancing Neural Encoding of Portuguese with Transformer Albertina PT-*}, author={João Rodrigues and Luís Gomes and João Silva and António Branco and Rodrigo Santos and Henrique Lopes Cardoso and Tomás Osório}, year={2023}, eprint={2305.06721}, archivePrefix={arXiv}, primaryClass={cs.CL} }



