five

muhammadravi251001/restructured_massive_sampled

收藏
Hugging Face2024-12-11 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/muhammadravi251001/restructured_massive_sampled
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含标签、文本和语言三个主要特征,分为训练集、验证集和测试集三个部分,分别包含340884、60843和89250个样本。数据集的下载大小为14611987字节,总大小为43474977.90100806字节。数据集的版权信息未知,且数据集的结构被重新组织以与其他研究中的数据集保持一致。

The dataset contains three main features: label, text, and lang. It is divided into three parts: train, validation, and test, containing 340884, 60843, and 89250 samples respectively. The download size of the dataset is 14611987 bytes, and the total size is 43474977.90100806 bytes. The copyright information of the dataset is unknown, and the structure of the dataset has been reorganized to be consistent with other datasets in our research.
提供机构:
muhammadravi251001
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作