five

PORTULAN/glue-ptpt

收藏
Hugging Face2023-05-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PORTULAN/glue-ptpt
下载链接
链接失效反馈
官方服务:
资源简介:
GLUE-PTPT数据集是通用语言理解评估基准(GLUE)的欧洲葡萄牙语翻译版本,用于评估Albertina PT-*模型。该数据集由机器生成,包含10K到100K之间的数据量。目前,只有四个任务(MRPC、RTE、STS-B、WNLI)被翻译成欧洲葡萄牙语,其余任务将在未来添加。

GLUE-PTPT数据集是通用语言理解评估基准(GLUE)的欧洲葡萄牙语翻译版本,用于评估Albertina PT-*模型。该数据集由机器生成,包含10K到100K之间的数据量。目前,只有四个任务(MRPC、RTE、STS-B、WNLI)被翻译成欧洲葡萄牙语,其余任务将在未来添加。
提供机构:
PORTULAN
原始信息汇总

GLUE-PTPT 数据集概述

基本信息

  • 语言: 欧洲葡萄牙语 (pt)
  • 语言创建者: 机器生成
  • 来源数据集: GLUE
  • 数据集大小: 10,000 < n < 100,000

数据集描述

  • 名称: GLUE-PTPT
  • 目的: 作为评估 Albertina PT-* 模型的基准,该模型是针对欧洲葡萄牙语的通用语言理解评估。

包含任务

  • MRPC
  • RTE
  • STS-B
  • WNLI

引用信息

若使用此数据集,请引用以下文献:

@misc{rodrigues2023advancing, title={Advancing Neural Encoding of Portuguese with Transformer Albertina PT-*}, author={João Rodrigues and Luís Gomes and João Silva and António Branco and Rodrigo Santos and Henrique Lopes Cardoso and Tomás Osório}, year={2023}, eprint={2305.06721}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作