nikhil-405/spanish_tokenized_train

Name: nikhil-405/spanish_tokenized_train
Creator: nikhil-405
Published: 2024-11-30 14:09:05
License: 暂无描述

Hugging Face2024-11-30 更新2024-12-14 收录

下载链接：

https://hf-mirror.com/datasets/nikhil-405/spanish_tokenized_train

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个西班牙语数据集，包含文本、输入ID、令牌类型ID和注意力掩码等特征。数据集被分割为训练集，包含12,649,267个示例，占用21,320,140,126字节。下载大小为2,480,791,141字节，数据集大小为21,320,140,126字节。

This dataset is a Spanish language dataset containing features such as text, input IDs, token type IDs, and attention masks. The dataset is split into a training set with 12,649,267 examples, occupying 21,320,140,126 bytes. The download size is 2,480,791,141 bytes, and the dataset size is 21,320,140,126 bytes.

提供机构：

nikhil-405

5,000+

优质数据集

54 个

任务类型

进入经典数据集