sartifyllc/SwahiliNewsClassification
收藏Hugging Face2024-07-01 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/sartifyllc/SwahiliNewsClassification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要字段:content和category,数据类型均为字符串。数据集包含一个训练集,共有24,275个样本,总大小为59,850,293字节。数据集的下载大小为33,513,495字节,总大小为59,850,293字节。数据文件的默认配置指定了训练数据文件的路径为data/train-*。
The dataset contains two main fields: content and category, both of which are of string data type. The dataset includes a training set with 24,275 samples, totaling 59,850,293 bytes. The download size of the dataset is 33,513,495 bytes, and the total size is 59,850,293 bytes. The default configuration of the data files specifies the path to the training data files as data/train-*.
提供机构:
sartifyllc
原始信息汇总
数据集概述
数据特征
- content: 数据类型为字符串。
- category: 数据类型为字符串。
数据分割
- train: 包含24275个样本,占用59850293字节。
数据集大小
- 下载大小: 33513495字节。
- 数据集大小: 59850293字节。
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



