AnanthZeke/tamil_sentences_master_raw

Name: AnanthZeke/tamil_sentences_master_raw
Creator: AnanthZeke
Published: 2023-04-07 05:25:02
License: 暂无描述

Hugging Face2023-04-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/AnanthZeke/tamil_sentences_master_raw

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: sent_token dtype: string splits: - name: train num_bytes: 20175735014 num_examples: 64948854 download_size: 6917303724 dataset_size: 20175735014 --- # Dataset Card for "tamil_sentences_master" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息：特征字段： - 名称：句子标记（sent_token）数据类型：字符串数据集划分： - 划分名称：训练集（train）占用字节数：20175735014 样本数量：64948854 下载大小：6917303724 数据集总大小：20175735014 # "tamil_sentences_master" 泰米尔语主句子数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

AnanthZeke

原始信息汇总

数据集概述

数据集名称

tamil_sentences_master

数据特征

名称: sent_token
数据类型: string

数据分割

分割名称: train
示例数量: 64948854
数据大小: 20175735014字节

下载信息

下载大小: 6917303724字节
数据集大小: 20175735014字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集