five

fourteenBDr/toutiao

收藏
Hugging Face2022-08-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fourteenBDr/toutiao
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个中文文本分类数据集,数据来源于今日头条客户端。每条数据包含新闻ID、分类code、分类名称、新闻标题和新闻关键词,字段间以`_!_`分割。数据集共包含382,688条数据,分布于15个分类中,数据采集时间为2018年05月。
提供机构:
fourteenBDr
原始信息汇总

中文文本分类数据集概述

数据来源

  • 今日头条客户端

数据格式

  • 每条数据包含五个字段,以_!_分隔:
    • 新闻ID
    • 分类code
    • 分类名称
    • 新闻标题
    • 新闻关键词

分类详情

  • 分类code与名称列表,共15个分类,例如:
    • 100: 民生 故事 (news_story)
    • 101: 文化 文化 (news_culture)
    • 102: 娱乐 娱乐 (news_entertainment)
    • ...

数据规模

  • 总计382688条数据

采集时间

  • 2018年05月
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作