five

haoranxu/WMT23-Test

收藏
Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/haoranxu/WMT23-Test
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: de-en features: - name: de-en struct: - name: de dtype: string - name: en dtype: string splits: - name: test num_bytes: 320901 num_examples: 549 download_size: 206261 dataset_size: 320901 - config_name: en-cs features: - name: en-cs struct: - name: en dtype: string - name: cs dtype: string splits: - name: test num_bytes: 431734 num_examples: 2074 download_size: 288875 dataset_size: 431734 - config_name: en-de features: - name: en-de struct: - name: en dtype: string - name: de dtype: string splits: - name: test num_bytes: 435393 num_examples: 557 download_size: 267671 dataset_size: 435393 - config_name: en-ru features: - name: en-ru struct: - name: en dtype: string - name: ru dtype: string splits: - name: test num_bytes: 595222 num_examples: 2074 download_size: 336184 dataset_size: 595222 - config_name: en-zh features: - name: en-zh struct: - name: en dtype: string - name: zh dtype: string splits: - name: test num_bytes: 396956 num_examples: 2074 download_size: 267187 dataset_size: 396956 - config_name: ru-en features: - name: ru-en struct: - name: ru dtype: string - name: en dtype: string splits: - name: test num_bytes: 496691 num_examples: 1723 download_size: 287075 dataset_size: 496691 - config_name: zh-en features: - name: zh-en struct: - name: zh dtype: string - name: en dtype: string splits: - name: test num_bytes: 527889 num_examples: 1976 download_size: 333360 dataset_size: 527889 configs: - config_name: de-en data_files: - split: test path: de-en/test-* - config_name: en-cs data_files: - split: test path: en-cs/test-* - config_name: en-de data_files: - split: test path: en-de/test-* - config_name: en-ru data_files: - split: test path: en-ru/test-* - config_name: en-zh data_files: - split: test path: en-zh/test-* - config_name: ru-en data_files: - split: test path: ru-en/test-* - config_name: zh-en data_files: - split: test path: zh-en/test-* --- # Dataset Card for "WMT23-Test" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: - 配置名称:de-en,特征为名为`de-en`的结构体,包含两个字段:`de`(德语,数据类型为字符串)与`en`(英语,数据类型为字符串);拆分集仅包含测试集,数据字节数为320901,样本总量为549;下载大小为206261,数据集总大小为320901。 - 配置名称:en-cs,特征为名为`en-cs`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`cs`(捷克语,数据类型为字符串);拆分集仅包含测试集,数据字节数为431734,样本总量为2074;下载大小为288875,数据集总大小为431734。 - 配置名称:en-de,特征为名为`en-de`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`de`(德语,数据类型为字符串);拆分集仅包含测试集,数据字节数为435393,样本总量为557;下载大小为267671,数据集总大小为435393。 - 配置名称:en-ru,特征为名为`en-ru`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`ru`(俄语,数据类型为字符串);拆分集仅包含测试集,数据字节数为595222,样本总量为2074;下载大小为336184,数据集总大小为595222。 - 配置名称:en-zh,特征为名为`en-zh`的结构体,包含两个字段:`en`(英语,数据类型为字符串)与`zh`(中文,数据类型为字符串);拆分集仅包含测试集,数据字节数为396956,样本总量为2074;下载大小为267187,数据集总大小为396956。 - 配置名称:ru-en,特征为名为`ru-en`的结构体,包含两个字段:`ru`(俄语,数据类型为字符串)与`en`(英语,数据类型为字符串);拆分集仅包含测试集,数据字节数为496691,样本总量为1723;下载大小为287075,数据集总大小为496691。 - 配置名称:zh-en,特征为名为`zh-en`的结构体,包含两个字段:`zh`(中文,数据类型为字符串)与`en`(英语,数据类型为字符串);拆分集仅包含测试集,数据字节数为527889,样本总量为1976;下载大小为333360,数据集总大小为527889。 配置项: - 配置名称:de-en,数据文件: - 拆分集:test,路径:de-en/test-* - 配置名称:en-cs,数据文件: - 拆分集:test,路径:en-cs/test-* - 配置名称:en-de,数据文件: - 拆分集:test,路径:en-de/test-* - 配置名称:en-ru,数据文件: - 拆分集:test,路径:en-ru/test-* - 配置名称:en-zh,数据文件: - 拆分集:test,路径:en-zh/test-* - 配置名称:ru-en,数据文件: - 拆分集:test,路径:ru-en/test-* - 配置名称:zh-en,数据文件: - 拆分集:test,路径:zh-en/test-* --- # "WMT23测试集"数据集卡片 [需要更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
haoranxu
原始信息汇总

数据集概述

配置信息

de-en

  • 特征:
    • de: 类型为 string
    • en: 类型为 string
  • 拆分:
    • test: 字节数为 320901,样本数为 549
  • 下载大小: 206261 字节
  • 数据集大小: 320901 字节

en-cs

  • 特征:
    • en: 类型为 string
    • cs: 类型为 string
  • 拆分:
    • test: 字节数为 431734,样本数为 2074
  • 下载大小: 288875 字节
  • 数据集大小: 431734 字节

en-de

  • 特征:
    • en: 类型为 string
    • de: 类型为 string
  • 拆分:
    • test: 字节数为 435393,样本数为 557
  • 下载大小: 267671 字节
  • 数据集大小: 435393 字节

en-ru

  • 特征:
    • en: 类型为 string
    • ru: 类型为 string
  • 拆分:
    • test: 字节数为 595222,样本数为 2074
  • 下载大小: 336184 字节
  • 数据集大小: 595222 字节

en-zh

  • 特征:
    • en: 类型为 string
    • zh: 类型为 string
  • 拆分:
    • test: 字节数为 396956,样本数为 2074
  • 下载大小: 267187 字节
  • 数据集大小: 396956 字节

ru-en

  • 特征:
    • ru: 类型为 string
    • en: 类型为 string
  • 拆分:
    • test: 字节数为 496691,样本数为 1723
  • 下载大小: 287075 字节
  • 数据集大小: 496691 字节

zh-en

  • 特征:
    • zh: 类型为 string
    • en: 类型为 string
  • 拆分:
    • test: 字节数为 527889,样本数为 1976
  • 下载大小: 333360 字节
  • 数据集大小: 527889 字节

数据文件路径

  • de-en:
    • test: de-en/test-*
  • en-cs:
    • test: en-cs/test-*
  • en-de:
    • test: en-de/test-*
  • en-ru:
    • test: en-ru/test-*
  • en-zh:
    • test: en-zh/test-*
  • ru-en:
    • test: ru-en/test-*
  • zh-en:
    • test: zh-en/test-*
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作