K-Monitor/kmdb_classification
收藏Hugging Face2025-10-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/K-Monitor/kmdb_classification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了文本内容、标题、描述、关键词、标签、URL、日期、是否手工标注、分数、标题分数以及报纸名称等字段。数据集被划分为训练集,共包含104,286个示例,数据集大小为415,806,640.05548567字节。
The dataset includes fields such as text content, title, description, keywords, label, URL, date, whether it is manually annotated, score, title score, and newspaper name. The dataset is divided into a training set, containing 104,286 examples, with a total size of 415,806,640.05548567 bytes.
提供机构:
K-Monitor
原始信息汇总
数据集概述
数据集特征
- text: 字符串类型
- title: 字符串类型
- description: 字符串类型
- keywords: 字符串序列
- label: 整数类型
- url: 字符串类型
- date: 字符串类型
- is_hand_annoted: 布尔类型
- score: 浮点数类型
- title_score: 浮点数类型
数据集划分
- 训练集:
- 示例数: 48498
- 字节数: 197423231
- 验证集:
- 示例数: 6579
- 字节数: 25309037
- 测试集:
- 示例数: 3605
- 字节数: 13542701
数据集大小
- 下载大小: 145726868 字节
- 数据集总大小: 236274969 字节
数据文件配置
- 默认配置:
- 训练集路径:
data/train-* - 验证集路径:
data/validation-* - 测试集路径:
data/test-*
- 训练集路径:



