hodopo/new_news
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/hodopo/new_news
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本内容及其对应的类别标签,主要用于分类任务。数据集分为训练集和测试集,训练集包含347个样本,测试集包含87个样本。每个样本包含三个特征:Content(内容,数据类型为字符串)、kategori(类别,数据类型为分类标签,包含10个类别)和label(标签,数据类型为整数)。数据集的下载大小为381030字节,总大小为715852字节。
该数据集包含文本内容及其对应的类别标签,主要用于分类任务。数据集分为训练集和测试集,训练集包含347个样本,测试集包含87个样本。每个样本包含三个特征:Content(内容,数据类型为字符串)、kategori(类别,数据类型为分类标签,包含10个类别)和label(标签,数据类型为整数)。数据集的下载大小为381030字节,总大小为715852字节。
提供机构:
hodopo
原始信息汇总
数据集概述
数据特征
- Content: 文本内容,数据类型为字符串。
- kategori: 类别标签,数据类型为分类标签,包含以下类别:
- 0: affiliasi_parpol
- 1: radikal
- 2: asusila, pelanggran etika
- 3: terorisme, komunisme, kelompok terlarang
- 4: narkoba
- 5: korupsi
- 6: indispliner, penyalahgunaan kekuasaan dan wewenang
- 7: hedonisme
- 8: moralitas
- 9: lgbt
- label: 标签,数据类型为整数。
数据分割
- train: 训练集,包含347个样本,总大小为572007字节。
- test: 测试集,包含87个样本,总大小为143845字节。
数据集大小
- 下载大小: 381030字节
- 数据集总大小: 715852字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



