minhbui/spell_6m_mix
收藏Hugging Face2024-06-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/minhbui/spell_6m_mix
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个越南语数据集,包含文本、摘要和拼写三个特征,数据类型均为字符串。数据集包含一个训练集,大小为2860213159字节,包含5999999个样本。下载大小为1289657699字节,数据集总大小为2860213159字节。
This dataset is a Vietnamese language dataset containing three features: text, summary, and spell, all of which are of string type. The dataset includes a training set with a size of 2860213159 bytes, containing 5999999 samples. The download size is 1289657699 bytes, and the total dataset size is 2860213159 bytes.
提供机构:
minhbui
原始信息汇总
数据集概述
数据集特征
- text:数据类型为字符串。
- summary:数据类型为字符串。
- spell:数据类型为字符串。
数据集划分
- 训练集(train):
- 示例数量:5999999
- 数据大小:2860213159字节
数据集大小
- 下载大小:1289657699字节
- 数据集总大小:2860213159字节
配置信息
- 默认配置(default):
- 训练数据路径:
data/train-*
- 训练数据路径:



