five

2020年7月至2023年10月人民日报官网新闻数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67d50ce2195d260905af955a&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
数据内容:数据集包含人民日报2020年7月至2023年10月之间的文本数据,总计文本79719件。用以支持新闻知识图谱的构建。不涉及个人隐私、社会机构及公共利益等敏感数据。 采集方案:通过收集公开数据、自动清洗提取的方式进行数据采集。 时间及地点:采集于2022年-2023年,媒体融合生产技术与系统国家实验室智能化视频生产系统研究部,杭州。
提供机构:
新华智云科技有限公司
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集收录了2020年7月至2023年10月期间人民日报官网的新闻文本,共计79719件,旨在支持新闻知识图谱的构建。数据通过公开采集和自动清洗方式获取,由新华智云科技有限公司在2022年至2023年于杭州整理完成。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务