shreevigneshs/iwslt-2023-en-ru-train-val-split-0.2
收藏Hugging Face2023-10-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shreevigneshs/iwslt-2023-en-ru-train-val-split-0.2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: en
dtype: string
- name: ru
dtype: string
- name: ru_annotated
dtype: string
- name: styles
dtype: int64
splits:
- name: if_test
num_bytes: 327410
num_examples: 600
- name: f_test
num_bytes: 327839
num_examples: 600
- name: f_flores
num_bytes: 414702
num_examples: 1012
- name: if_flores
num_bytes: 414702
num_examples: 1012
download_size: 836846
dataset_size: 1484653
language:
- ru
- en
---
# Dataset Card for "iwslt-2023-en-ru-train-val-split-0.2"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征项:
- 字段名:en,数据类型:字符串
- 字段名:ru,数据类型:字符串
- 字段名:ru_annotated,数据类型:字符串
- 字段名:styles,数据类型:64位整数
数据集划分:
- 划分名称:if_test,字节数:327410,样本数量:600
- 划分名称:f_test,字节数:327839,样本数量:600
- 划分名称:f_flores,字节数:414702,样本数量:1012
- 划分名称:if_flores,字节数:414702,样本数量:1012
下载大小:836846 字节
数据集总大小:1484653 字节
涉及语言:
- 俄语(ru)
- 英语(en)
---
# "iwslt-2023-en-ru-train-val-split-0.2" 数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
shreevigneshs
原始信息汇总
数据集概述
数据集名称
- 名称: iwslt-2023-en-ru-train-val-split-0.2
数据集特征
- 特征列表:
- en: 数据类型为字符串
- ru: 数据类型为字符串
- ru_annotated: 数据类型为字符串
- styles: 数据类型为int64
数据集分割
- 分割详情:
- if_test: 包含600个示例,总字节数为327410
- f_test: 包含600个示例,总字节数为327839
- f_flores: 包含1012个示例,总字节数为414702
- if_flores: 包含1012个示例,总字节数为414702
数据集大小
- 下载大小: 836846字节
- 数据集大小: 1484653字节
语言
- 支持语言:
- 俄语 (ru)
- 英语 (en)



