quan246/half_doc_news_train
收藏Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/quan246/half_doc_news_train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于训练的翻译对,主要涉及英语(en)和越南语(vi)之间的翻译。数据集分为训练集(train)和开发集(dev),分别包含1000和100个示例。训练集的总字节数为277928,开发集的总字节数为26405。整个数据集的下载大小为178400字节,数据集总大小为304333字节。
该数据集包含用于训练的翻译对,主要涉及英语(en)和越南语(vi)之间的翻译。数据集分为训练集(train)和开发集(dev),分别包含1000和100个示例。训练集的总字节数为277928,开发集的总字节数为26405。整个数据集的下载大小为178400字节,数据集总大小为304333字节。
提供机构:
quan246
原始信息汇总
数据集概述
配置信息
- 默认配置 (
config_name: default)- 训练数据 (
split: train):路径为data/train-* - 开发数据 (
split: dev):路径为data/dev-*
- 训练数据 (
数据集信息
-
特征
- 翻译 (
name: translation)- 英文 (
name: en,dtype: string) - 越南文 (
name: vi,dtype: string)
- 英文 (
- 翻译 (
-
分割
- 训练集 (
name: train)- 数据大小:277928字节
- 样本数量:1000
- 开发集 (
name: dev)- 数据大小:26405字节
- 样本数量:100
- 训练集 (
-
下载大小:178400字节
-
数据集总大小:304333字节



