five

Visual Genome Dataset V1.2

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Visual_Genome_Dataset_V1_dot_2
下载链接
链接失效反馈
官方服务:
资源简介:
视觉基因组是与图像和图像内容的语义信息相关的数据集。与ImageNet图像标注数据集相比,具有更丰富的语义信息,用于扩展基于图像和语义信息的人工智能应用。 该数据集目前包含 108,249 张图像、420 万个区域内容描述、170 万个图像内容问答、210 万个对象案例、180 万个属性和 180 万个关系。 该数据集于 2015 年由斯坦福大学首次发布,随后是 2016 年的 1.2 和 2017 年的 1.4。

Visual Genome is a dataset centered on images and the semantic information of their content. Compared with the ImageNet image annotation dataset, it features richer semantic information and is designed to expand AI applications based on image and semantic information. Currently, this dataset includes 108,249 images, 4.2 million regional content descriptions, 1.7 million image content question-answer pairs, 2.1 million object instances, 1.8 million attributes, and 1.8 million relationships. It was first released by Stanford University in 2015, followed by version 1.2 in 2016 and version 1.4 in 2017.
提供机构:
OpenDataLab
创建时间:
2022-03-17
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Visual Genome Dataset V1.2是一个大规模多模态数据集,包含10.8万张图像及密集的语义标注,如区域描述、问答对、对象、属性和关系,总计超过千万个标注项,用于扩展基于图像和语言的人工智能应用。该数据集由斯坦福大学等机构于2016年发布,作为经典基准测试数据集,支持预训练和图像描述等任务,遵循CC BY 4.0许可协议。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作