anvilarth/lvis

Name: anvilarth/lvis
Creator: anvilarth
Published: 2024-01-17 15:20:57
License: 暂无描述

Hugging Face2024-01-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/anvilarth/lvis

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是LVIS数据集在Hugging Face平台上的实现。数据集包含训练集、验证集和测试集，每个数据集包含图像的ID、图像文件、高度、宽度以及对象信息（如边界框、类别和分割信息）。

提供机构：

anvilarth

原始信息汇总

LVIS 数据集概述

数据集摘要

LVIS 数据集是 Hugging Face 数据集库中的一个实现。更多信息请访问原始网站：https://www.lvisdataset.org/

数据加载

以下代码返回训练、验证和测试生成器：

python from datasets import load_dataset

dataset = load_dataset("winvoker/lvis")

数据结构

数据集包含训练、验证和测试三个部分，每个部分的数据结构如下：

训练集

特征：[id, image, height, width, objects]
行数：100170

验证集

特征：[id, image, height, width, objects]
行数：4809

测试集

特征：[id, image, height, width, objects]
行数：19822

访问生成器

可以通过以下方式访问训练、验证和测试集：

python train = dataset["train"] validation = dataset["validation"] test = dataset["test"]

示例数据

以下是一个示例数据行：

json { id: 0, image: 000000437561.jpg, height: 480, width: 640, objects: { bboxes: [[[392, 271, 14, 3]]], classes: [117], segmentation: [[376, 272, 375, 270, 372, 269, 371, 269, 373, 269, 373]] } }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，大规模实例分割数据集LVIS的构建采用了众包标注策略，通过亚马逊机械土耳其平台收集了超过1600个类别的物体标注。该数据集基于COCO数据集图像进行扩展，标注过程遵循严格的协议，确保每个类别在训练集中至少出现10次，同时引入稀有类别以增强数据多样性。构建过程中，标注者需识别并精确勾勒物体轮廓，生成高质量的实例分割掩码，最终形成包含超过200万实例标注的综合性数据集。

特点

LVIS数据集以其广泛的类别覆盖和长尾分布特性著称，涵盖1203个细粒度物体类别，其中许多类别在传统数据集中较为罕见。数据集的标注信息包括边界框、类别标签及实例分割掩码，支持复杂的视觉任务。其独特的评估协议区分常见、稀有和未见类别，为模型在长尾场景下的性能评估提供了标准基准。图像来源于真实世界场景，具有丰富的上下文信息和多样的视觉表现。

使用方法

使用LVIS数据集时，可通过Hugging Face的datasets库直接加载，分为训练集、验证集和测试集三个部分。加载后，数据以字典形式呈现，包含图像ID、图像数据、尺寸及物体标注信息。标注信息存储在objects字段中，涵盖边界框、类别和分割掩码。研究人员可利用该数据集训练实例分割模型，或通过其标准评估工具进行性能验证，适用于长尾识别、零样本学习等前沿研究方向。

背景与挑战

背景概述

LVIS数据集由Facebook AI Research于2019年推出，旨在推动大规模词汇实例分割领域的发展。该数据集聚焦于解决现实世界中物体类别的长尾分布问题，涵盖了超过1200个细粒度类别，其标注精细度远超同期数据集。核心研究问题在于如何提升模型对罕见类别的识别能力，从而推动计算机视觉系统在开放环境下的实用化。LVIS的出现显著影响了实例分割、物体检测及少样本学习等多个研究方向，为学术界提供了宝贵的基准资源。

当前挑战

LVIS数据集所针对的领域挑战主要在于长尾分布下的实例分割，即模型在大量罕见类别上表现不佳的问题。构建过程中的挑战包括细粒度标注的复杂性，需要精确的边界框与分割掩码，以及对超过1200个类别的语义一致性维护。此外，数据收集需确保类别平衡与多样性，避免标注偏差，这些因素共同增加了数据集构建的难度与成本。

常用场景

经典使用场景

在计算机视觉领域，大规模实例分割任务常面临长尾分布带来的挑战。LVIS数据集以其超过1200个细粒度类别和丰富的标注信息，为研究者提供了评估模型在罕见类别上性能的基准。该数据集常用于训练和验证实例分割模型，特别是在处理类别不均衡问题时，通过其精细的边界框和分割掩码标注，推动模型在复杂场景下的泛化能力提升。

解决学术问题

LVIS数据集主要解决了实例分割中长尾分布导致的模型偏差问题。传统数据集往往忽略罕见类别，而LVIS通过均衡的类别采样和详尽的标注，使研究者能够系统评估模型对低频对象的识别能力。这不仅促进了长尾学习理论的发展，还为解决现实世界中类别不均衡的视觉任务提供了实证基础，推动了计算机视觉向更公平、更全面的方向发展。

衍生相关工作

围绕LVIS数据集，已衍生出多项经典研究工作。例如，长尾实例分割方法如EQLv2和Seesaw Loss，通过重新设计损失函数来缓解类别不均衡；此外，基于LVIS的基准测试催生了改进的检测架构如Mask R-CNN的变体，这些工作不仅提升了模型性能，还推动了数据增强、半监督学习等技术在实例分割中的应用，形成了持续的研究脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集