five

VisualGenome

收藏
魔搭社区2026-05-14 更新2025-08-30 收录
下载链接:
https://modelscope.cn/datasets/leehirwin0215/VisualGenome
下载链接
链接失效反馈
官方服务:
资源简介:
VisualGenome 是一个大规模的多模态数据集,旨在为计算机视觉和自然语言处理任务提供丰富的视觉和语义信息。该数据集包含了超过 108,000 张图像,每张图像都附带有详细的注释,包括对象、属性、关系、区域描述和问答对。这些注释为图像中的视觉元素提供了深层次的语义理解,使得 VisualGenome 成为训练和评估视觉理解模型的宝贵资源。

VisualGenome is a large-scale multimodal dataset developed to provide rich visual and semantic information for computer vision and natural language processing tasks. This dataset contains over 108,000 images, each accompanied by detailed annotations including objects, attributes, relationships, region descriptions, and question-answer pairs. These annotations offer in-depth semantic understanding of the visual elements within the images, making VisualGenome a valuable resource for training and evaluating visual understanding models.
提供机构:
maas
创建时间:
2025-08-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
VisualGenome是一个包含108,000多张图片的大规模多模态数据集,每张图片都有详细的对象、属性、关系和问答对注释,适用于计算机视觉和自然语言处理任务。该数据集通过丰富的注释支持图像生成、视觉问答和场景理解等复杂任务,是训练视觉理解模型的理想资源。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作