shreevigneshs/iwslt-2023-en-ko-train-split
收藏Hugging Face2023-03-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shreevigneshs/iwslt-2023-en-ko-train-split
下载链接
链接失效反馈官方服务:
资源简介:
---
license: gpl-3.0
dataset_info:
features:
- name: en
dtype: string
- name: ko
dtype: string
- name: ko_annotated
dtype: string
- name: styles
dtype: int64
splits:
- name: train
num_bytes: 255812
num_examples: 640
- name: val
num_bytes: 59640
num_examples: 160
- name: if_test
num_bytes: 29151
num_examples: 80
- name: f_test
num_bytes: 30489
num_examples: 80
download_size: 202991
dataset_size: 375092
---
---
许可证: GPL-3.0
数据集信息:
特征:
- 名称: en(英文文本字段)
数据类型: 字符串
- 名称: ko(韩语文本字段)
数据类型: 字符串
- 名称: ko_annotated(带标注的韩语文本字段)
数据类型: 字符串
- 名称: styles(风格标签)
数据类型: 64位整数
数据划分:
- 名称: train(训练集)
字节数: 255812
样本数: 640
- 名称: val(验证集)
字节数: 59640
样本数: 160
- 名称: if_test
字节数: 29151
样本数: 80
- 名称: f_test
字节数: 30489
样本数: 80
下载大小: 202991
数据集总大小: 375092
---
提供机构:
shreevigneshs
原始信息汇总
数据集概述
数据集特征
- en: 数据类型为字符串
- ko: 数据类型为字符串
- ko_annotated: 数据类型为字符串
- styles: 数据类型为整数(int64)
数据集分割
- train: 包含640个示例,总大小为255812字节
- val: 包含160个示例,总大小为59640字节
- if_test: 包含80个示例,总大小为29151字节
- f_test: 包含80个示例,总大小为30489字节
数据集大小
- 下载大小: 202991字节
- 数据集总大小: 375092字节



