anirudhlakhotia/baarat-batched-hindi-pre-training

Name: anirudhlakhotia/baarat-batched-hindi-pre-training
Creator: anirudhlakhotia
Published: 2024-03-15 07:16:32
License: 暂无描述

Hugging Face2024-03-15 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/anirudhlakhotia/baarat-batched-hindi-pre-training

下载链接

链接失效反馈

官方服务：

资源简介：

--- language: - hi dataset_info: features: - name: text dtype: string splits: - name: train num_bytes: 23080432881 num_examples: 8780938 download_size: 9371674517 dataset_size: 23080432881 configs: - config_name: default data_files: - split: train path: data/train-* ---

语言： - 印地语（Hindi）数据集信息：特征： - 名称：文本（text）数据类型：字符串（string）划分集： - 名称：训练集（train）字节数：23080432881 样本数量：8780938 下载大小：9371674517 数据集总大小：23080432881 配置项： - 配置名称：默认配置（default）数据文件： - 划分集：训练集（train）路径：data/train-*

提供机构：

anirudhlakhotia

原始信息汇总

数据集概述

数据集基本信息

语言: 印地语 (hi)
数据集大小: 23080432881 字节
下载大小: 9371674517 字节

数据集特征

特征名称: text
数据类型: string

数据集分割

分割名称: train
示例数量: 8780938
字节数: 23080432881 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集