haoranxu/WMT23-Test
收藏Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/haoranxu/WMT23-Test
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: de-en
features:
- name: de-en
struct:
- name: de
dtype: string
- name: en
dtype: string
splits:
- name: test
num_bytes: 320901
num_examples: 549
download_size: 206261
dataset_size: 320901
- config_name: en-cs
features:
- name: en-cs
struct:
- name: en
dtype: string
- name: cs
dtype: string
splits:
- name: test
num_bytes: 431734
num_examples: 2074
download_size: 288875
dataset_size: 431734
- config_name: en-de
features:
- name: en-de
struct:
- name: en
dtype: string
- name: de
dtype: string
splits:
- name: test
num_bytes: 435393
num_examples: 557
download_size: 267671
dataset_size: 435393
- config_name: en-ru
features:
- name: en-ru
struct:
- name: en
dtype: string
- name: ru
dtype: string
splits:
- name: test
num_bytes: 595222
num_examples: 2074
download_size: 336184
dataset_size: 595222
- config_name: en-zh
features:
- name: en-zh
struct:
- name: en
dtype: string
- name: zh
dtype: string
splits:
- name: test
num_bytes: 396956
num_examples: 2074
download_size: 267187
dataset_size: 396956
- config_name: ru-en
features:
- name: ru-en
struct:
- name: ru
dtype: string
- name: en
dtype: string
splits:
- name: test
num_bytes: 496691
num_examples: 1723
download_size: 287075
dataset_size: 496691
- config_name: zh-en
features:
- name: zh-en
struct:
- name: zh
dtype: string
- name: en
dtype: string
splits:
- name: test
num_bytes: 527889
num_examples: 1976
download_size: 333360
dataset_size: 527889
configs:
- config_name: de-en
data_files:
- split: test
path: de-en/test-*
- config_name: en-cs
data_files:
- split: test
path: en-cs/test-*
- config_name: en-de
data_files:
- split: test
path: en-de/test-*
- config_name: en-ru
data_files:
- split: test
path: en-ru/test-*
- config_name: en-zh
data_files:
- split: test
path: en-zh/test-*
- config_name: ru-en
data_files:
- split: test
path: ru-en/test-*
- config_name: zh-en
data_files:
- split: test
path: zh-en/test-*
---
# Dataset Card for "WMT23-Test"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
- 配置名称:de-en,特征为名为`de-en`的结构体,包含两个字段:`de`(德语,数据类型为字符串)与`en`(英语,数据类型为字符串);拆分集仅包含测试集,数据字节数为320901,样本总量为549;下载大小为206261,数据集总大小为320901。
- 配置名称:en-cs,特征为名为`en-cs`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`cs`(捷克语,数据类型为字符串);拆分集仅包含测试集,数据字节数为431734,样本总量为2074;下载大小为288875,数据集总大小为431734。
- 配置名称:en-de,特征为名为`en-de`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`de`(德语,数据类型为字符串);拆分集仅包含测试集,数据字节数为435393,样本总量为557;下载大小为267671,数据集总大小为435393。
- 配置名称:en-ru,特征为名为`en-ru`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`ru`(俄语,数据类型为字符串);拆分集仅包含测试集,数据字节数为595222,样本总量为2074;下载大小为336184,数据集总大小为595222。
- 配置名称:en-zh,特征为名为`en-zh`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`zh`(中文,数据类型为字符串);拆分集仅包含测试集,数据字节数为396956,样本总量为2074;下载大小为267187,数据集总大小为396956。
- 配置名称:ru-en,特征为名为`ru-en`的结构体,包含两个字段:`ru`(俄语,数据类型为字符串)与`en`(英语,数据类型为字符串);拆分集仅包含测试集,数据字节数为496691,样本总量为1723;下载大小为287075,数据集总大小为496691。
- 配置名称:zh-en,特征为名为`zh-en`的结构体,包含两个字段:`zh`(中文,数据类型为字符串)与`en`(英语,数据类型为字符串);拆分集仅包含测试集,数据字节数为527889,样本总量为1976;下载大小为333360,数据集总大小为527889。
配置项:
- 配置名称:de-en,数据文件:
- 拆分集:test,路径:de-en/test-*
- 配置名称:en-cs,数据文件:
- 拆分集:test,路径:en-cs/test-*
- 配置名称:en-de,数据文件:
- 拆分集:test,路径:en-de/test-*
- 配置名称:en-ru,数据文件:
- 拆分集:test,路径:en-ru/test-*
- 配置名称:en-zh,数据文件:
- 拆分集:test,路径:en-zh/test-*
- 配置名称:ru-en,数据文件:
- 拆分集:test,路径:ru-en/test-*
- 配置名称:zh-en,数据文件:
- 拆分集:test,路径:zh-en/test-*
---
# "WMT23测试集"数据集卡片
[需要更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
haoranxu
原始信息汇总
数据集概述
配置信息
de-en
- 特征:
de: 类型为stringen: 类型为string
- 拆分:
test: 字节数为 320901,样本数为 549
- 下载大小: 206261 字节
- 数据集大小: 320901 字节
en-cs
- 特征:
en: 类型为stringcs: 类型为string
- 拆分:
test: 字节数为 431734,样本数为 2074
- 下载大小: 288875 字节
- 数据集大小: 431734 字节
en-de
- 特征:
en: 类型为stringde: 类型为string
- 拆分:
test: 字节数为 435393,样本数为 557
- 下载大小: 267671 字节
- 数据集大小: 435393 字节
en-ru
- 特征:
en: 类型为stringru: 类型为string
- 拆分:
test: 字节数为 595222,样本数为 2074
- 下载大小: 336184 字节
- 数据集大小: 595222 字节
en-zh
- 特征:
en: 类型为stringzh: 类型为string
- 拆分:
test: 字节数为 396956,样本数为 2074
- 下载大小: 267187 字节
- 数据集大小: 396956 字节
ru-en
- 特征:
ru: 类型为stringen: 类型为string
- 拆分:
test: 字节数为 496691,样本数为 1723
- 下载大小: 287075 字节
- 数据集大小: 496691 字节
zh-en
- 特征:
zh: 类型为stringen: 类型为string
- 拆分:
test: 字节数为 527889,样本数为 1976
- 下载大小: 333360 字节
- 数据集大小: 527889 字节
数据文件路径
- de-en:
test:de-en/test-*
- en-cs:
test:en-cs/test-*
- en-de:
test:en-de/test-*
- en-ru:
test:en-ru/test-*
- en-zh:
test:en-zh/test-*
- ru-en:
test:ru-en/test-*
- zh-en:
test:zh-en/test-*
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



