hgissbkh/ALMA-Preference-Mono-xCOMET-QE
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/hgissbkh/ALMA-Preference-Mono-xCOMET-QE
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,涉及源语言、目标语言、源文本、参考文本、被拒绝的翻译、选择的翻译、基础翻译等,还包括一些与翻译质量评分相关的字段。数据集仅包含一个训练集,共有20575个样本,总大小为16811860字节。
This dataset is primarily used for machine translation and text evaluation tasks. It includes multiple features such as language pair, source language, target language, source text, reference text, and various evaluation metrics like rejected_xcomet, chosen_xcomet, etc. The dataset is divided into a training set with 20575 examples.
提供机构:
hgissbkh
原始信息汇总
数据集概述
数据集信息
特征
- lp: 字符串类型
- src_lang: 字符串类型
- tgt_lang: 字符串类型
- src: 字符串类型
- ref: 字符串类型
- rejected: 字符串类型
- chosen: 字符串类型
- base: 字符串类型
- rejected_xcomet: 浮点数类型
- chosen_xcomet: 浮点数类型
- base_xcomet: 浮点数类型
- rejected_kiwi: 浮点数类型
- chosen_kiwi: 浮点数类型
- base_kiwi: 浮点数类型
- rejected_chrf: 浮点数类型
- chosen_chrf: 浮点数类型
- base_chrf: 浮点数类型
数据分割
- train:
- 字节数: 16811860
- 样本数: 20575
数据集大小
- 下载大小: 11166425
- 数据集大小: 16811860
配置
- config_name: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



