applied-ai-018/pretraining_v2-omega_v2_multi_lingual

Name: applied-ai-018/pretraining_v2-omega_v2_multi_lingual
Creator: applied-ai-018
Published: 2024-07-31 10:00:49
License: 暂无描述

Hugging Face2024-07-31 更新2024-12-14 收录

下载链接：

https://hf-mirror.com/datasets/applied-ai-018/pretraining_v2-omega_v2_multi_lingual

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多种语言的文本数据，每种语言对应一个配置名称，如ar（阿拉伯语）、bn（孟加拉语）、es（西班牙语）等。每个配置下有一个train分割，包含文本数据，数据类型为字符串。数据集的大小和下载大小也因语言不同而有所差异。

This dataset contains text data in multiple languages, each corresponding to a configuration name such as ar (Arabic), bn (Bengali), es (Spanish), etc. Each configuration has a train split containing text data with a string data type. The size of the dataset and the download size vary depending on the language.

提供机构：

applied-ai-018

5,000+

优质数据集

54 个

任务类型

进入经典数据集