新华江苏政情数据集
收藏江苏数据交易所2026-01-30 收录
下载链接:
https://exchange.jsdataex.com/trade-home/#/project/tradingMarket/productDetail?productId=5499
下载链接
链接失效反馈官方服务:
资源简介:
数据集为文本、图像、视频三模态融合,计划汇聚包含200万条政务新闻文本、80万张现场高清图、2万小时4K/8K视频。文本已做实体、事件、政策主题三级标签;图像完成人脸、场景、文字检测;视频已按镜头切分、关键帧抽取、字幕对齐。整体数据规模约230TB,可按“政策—人物—时间—地点”四维交叉检索。
提供机构:
江苏新华日报大数据有限公司
搜集汇总
背景与挑战
背景概述
新华江苏政情数据集是一个多模态政务数据集,融合了文本、图像和视频三种数据类型,总规模约230TB,包含大量政务新闻、高清图片和视频资源。数据集已进行精细处理,如文本的实体、事件和政策主题标签,图像的人脸和场景检测,以及视频的镜头切分和字幕对齐。它支持按'政策—人物—时间—地点'四维交叉检索,便于用户高效分析和挖掘江苏地区的政情信息。
以上内容由遇见数据集搜集并总结生成



