five

中国移动通用场景图文数据集

收藏
国家数据集管理服务平台2026-05-28 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=4b83777905ddabed0bb86bbbb08127a4
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为通用场景图文配对数据集,涵盖日常生活、自然景观、艺术时尚等各类场景的图像及对应文本描述、核心元素标签,覆盖人物、美食、风景、建筑、城市、艺术等多类别内容。样本描述语言支持中文与英文,同步提供图像主要元素标注标签,具备强场景属性、图文对应属性与多语言属性,适合用于多模态大模型训练、图文一致性校验、图像分类、文生图模型优化、智能标签生成、图像内容检索及视觉内容审核。

This is a general-scenario image-text pairing dataset. It covers images from various scenarios such as daily life, natural landscapes, art and fashion, along with their corresponding text descriptions and core element tags, and encompasses diverse categories including people, food, scenery, architecture, cities, art and more. The sample descriptions support both Chinese and English, and annotated tags for the main elements of the images are also provided. This dataset features strong scenario relevance, accurate image-text alignment and multilingual capabilities, making it suitable for training multimodal large language models, image-text consistency verification, image classification, text-to-image model optimization, intelligent tag generation, image content retrieval and visual content auditing.
提供机构:
中移九天人工智能科技(北京)有限公司
创建时间:
2026-04-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个通用场景图文配对数据集,包含日常生活、自然景观、艺术时尚等多类场景的图像及其对应的中英文文本描述与核心元素标签。它具备强场景、图文对应和多语言属性,适用于多模态大模型训练、图文一致性校验、图像分类等多种人工智能应用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务