Tippawan/netflix
收藏Hugging Face2024-03-08 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/Tippawan/netflix
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含英语和泰语之间的翻译对,数据集分为训练集、验证集和测试集。训练集包含67,224个样本,验证集和测试集各包含8,403个样本。每个样本包含一个英语字符串和一个泰语字符串。数据集的总下载大小为6,461,900字节,总数据集大小为11,751,645字节。
该数据集包含英语和泰语之间的翻译对,数据集分为训练集、验证集和测试集。训练集包含67,224个样本,验证集和测试集各包含8,403个样本。每个样本包含一个英语字符串和一个泰语字符串。数据集的总下载大小为6,461,900字节,总数据集大小为11,751,645字节。
提供机构:
Tippawan
原始信息汇总
数据集概述
特征信息
- 名称: translation
- 结构:
- 名称: en
- 数据类型: string
- 名称: th
- 数据类型: string
- 名称: en
- 结构:
数据分割
- 训练集:
- 字节数: 9414659
- 样本数: 67224
- 验证集:
- 字节数: 1173285
- 样本数: 8403
- 测试集:
- 字节数: 1163701
- 样本数: 8403
数据大小
- 下载大小: 6461900 字节
- 数据集大小: 11751645 字节
配置信息
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 分割: validation
- 路径: data/validation-*
- 分割: test
- 路径: data/test-*
- 分割: train
- 数据文件:



