文章分类
收藏山西数据交易平台2021-02-05 更新2024-03-01 收录
下载链接:
http://106.13.54.96/datahub/tradepage/mall/intr?id=411
下载链接
链接失效反馈官方服务:
资源简介:
对文章按照内容类型进行自动分类,首批支持娱乐、体育、科技等26个主流内容类型,为文章聚类、文本内容分析等应用提供基础技术支持。 目前支持的一级粗粒度分类类目如下:1、国际 2、体育 3、娱乐 4、社会 5、财经 6、时事 7、科技 8、情感 9、汽车 10、教育 11、时尚 12、游戏 13、军事 14、旅游 15、美食 16、文化 17、健康养生 18、搞笑 19、家居 20、动漫 21、宠物
This dataset enables automatic classification of articles based on their content types. It initially supports 26 mainstream content categories including entertainment, sports, technology and others, providing foundational technical support for applications such as article clustering and text content analysis. The currently supported first-level coarse-grained classification categories are as follows: 1. International 2. Sports 3. Entertainment 4. Society 5. Finance and Economics 6. Current Affairs 7. Technology 8. Emotion 9. Automobiles 10. Education 11. Fashion 12. Gaming 13. Military Affairs 14. Tourism 15. Cuisine 16. Culture 17. Health and Wellness 18. Humor 19. Home Furnishings 20. Animation 21. Pets
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于文章自动分类的自然语言处理数据集,支持26个主流内容类型,如娱乐、体育、科技等,适用于文章聚类和文本内容分析。数据集发布于2021年,每年进行增量更新。
以上内容由遇见数据集搜集并总结生成



