LazarusNLP/stsb_mt_id
收藏Hugging Face2024-01-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LazarusNLP/stsb_mt_id
下载链接
链接失效反馈官方服务:
资源简介:
这是一个机器翻译的印尼语STS-B数据集,用于评估模型在翻译测试集上的Spearman相关系数得分。数据集是通过Google Translate API将STS-B测试集翻译成印尼语生成的,目的是为了提供一个合成基线。
这是一个机器翻译的印尼语STS-B数据集,用于评估模型在翻译测试集上的Spearman相关系数得分。数据集是通过Google Translate API将STS-B测试集翻译成印尼语生成的,目的是为了提供一个合成基线。
提供机构:
LazarusNLP
原始信息汇总
数据集概述
数据集特征
- domain: 数据类型为字符串
- data: 数据类型为字符串
- type: 数据类型为字符串
- score: 数据类型为字符串
- correlation: 数据类型为字符串
- text_1: 数据类型为字符串
- text_2: 数据类型为字符串
数据集分割
- test: 包含1379个样本,总大小为253093字节
- validation: 包含1500个样本,总大小为305450字节
数据集大小
- 下载大小: 268625字节
- 数据集总大小: 558543字节



