ILT37/viwiki

Name: ILT37/viwiki
Creator: ILT37
Published: 2024-07-04 13:19:01
License: 暂无描述

Hugging Face2024-07-04 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/ILT37/viwiki

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个越南语数据集，包含文件名和文本内容两个主要特征。数据集分为一个训练集，包含7878个例子，总大小为84676528字节。

This dataset is a Vietnamese language dataset containing two main features: filename and text content. The dataset is divided into a training set, which includes 7878 examples with a total size of 84676528 bytes.

提供机构：

ILT37

原始信息汇总

数据集概述

语言

越南语 (vi)

数据集信息

特征

filename: 文件名，数据类型为字符串 (string)
text: 文本内容，数据类型为字符串 (string)

数据分割

train: 训练集
- 字节数: 84676528
- 样本数: 7878

数据大小

下载大小: 43054161 字节
数据集大小: 84676528 字节

配置

config_name: default
- data_files:
  - split: train
  - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集