five

anvilarth/lvis

收藏
Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/anvilarth/lvis
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是LVIS数据集在Hugging Face平台上的实现。数据集包含训练集、验证集和测试集,每个数据集包含图像的ID、图像文件、高度、宽度以及对象信息(如边界框、类别和分割信息)。

该数据集是LVIS数据集在Hugging Face平台上的实现。数据集包含训练集、验证集和测试集,每个数据集包含图像的ID、图像文件、高度、宽度以及对象信息(如边界框、类别和分割信息)。
提供机构:
anvilarth
原始信息汇总

LVIS 数据集概述

数据集摘要

LVIS 数据集是 Hugging Face 数据集库中的一个实现。更多信息请访问原始网站:https://www.lvisdataset.org/

数据加载

以下代码返回训练、验证和测试生成器:

python from datasets import load_dataset

dataset = load_dataset("winvoker/lvis")

数据结构

数据集包含训练、验证和测试三个部分,每个部分的数据结构如下:

训练集

  • 特征:[id, image, height, width, objects]
  • 行数:100170

验证集

  • 特征:[id, image, height, width, objects]
  • 行数:4809

测试集

  • 特征:[id, image, height, width, objects]
  • 行数:19822

访问生成器

可以通过以下方式访问训练、验证和测试集:

python train = dataset["train"] validation = dataset["validation"] test = dataset["test"]

示例数据

以下是一个示例数据行:

json { id: 0, image: 000000437561.jpg, height: 480, width: 640, objects: { bboxes: [[[392, 271, 14, 3]]], classes: [117], segmentation: [[376, 272, 375, 270, 372, 269, 371, 269, 373, 269, 373]] } }

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,大规模实例分割数据集LVIS的构建采用了众包标注策略,通过亚马逊机械土耳其平台收集了超过1600个类别的物体标注。该数据集基于COCO数据集图像进行扩展,标注过程遵循严格的协议,确保每个类别在训练集中至少出现10次,同时引入稀有类别以增强数据多样性。构建过程中,标注者需识别并精确勾勒物体轮廓,生成高质量的实例分割掩码,最终形成包含超过200万实例标注的综合性数据集。
特点
LVIS数据集以其广泛的类别覆盖和长尾分布特性著称,涵盖1203个细粒度物体类别,其中许多类别在传统数据集中较为罕见。数据集的标注信息包括边界框、类别标签及实例分割掩码,支持复杂的视觉任务。其独特的评估协议区分常见、稀有和未见类别,为模型在长尾场景下的性能评估提供了标准基准。图像来源于真实世界场景,具有丰富的上下文信息和多样的视觉表现。
使用方法
使用LVIS数据集时,可通过Hugging Face的datasets库直接加载,分为训练集、验证集和测试集三个部分。加载后,数据以字典形式呈现,包含图像ID、图像数据、尺寸及物体标注信息。标注信息存储在objects字段中,涵盖边界框、类别和分割掩码。研究人员可利用该数据集训练实例分割模型,或通过其标准评估工具进行性能验证,适用于长尾识别、零样本学习等前沿研究方向。
背景与挑战
背景概述
LVIS数据集由Facebook AI Research于2019年推出,旨在推动大规模词汇实例分割领域的发展。该数据集聚焦于解决现实世界中物体类别的长尾分布问题,涵盖了超过1200个细粒度类别,其标注精细度远超同期数据集。核心研究问题在于如何提升模型对罕见类别的识别能力,从而推动计算机视觉系统在开放环境下的实用化。LVIS的出现显著影响了实例分割、物体检测及少样本学习等多个研究方向,为学术界提供了宝贵的基准资源。
当前挑战
LVIS数据集所针对的领域挑战主要在于长尾分布下的实例分割,即模型在大量罕见类别上表现不佳的问题。构建过程中的挑战包括细粒度标注的复杂性,需要精确的边界框与分割掩码,以及对超过1200个类别的语义一致性维护。此外,数据收集需确保类别平衡与多样性,避免标注偏差,这些因素共同增加了数据集构建的难度与成本。
常用场景
经典使用场景
在计算机视觉领域,大规模实例分割任务常面临长尾分布带来的挑战。LVIS数据集以其超过1200个细粒度类别和丰富的标注信息,为研究者提供了评估模型在罕见类别上性能的基准。该数据集常用于训练和验证实例分割模型,特别是在处理类别不均衡问题时,通过其精细的边界框和分割掩码标注,推动模型在复杂场景下的泛化能力提升。
解决学术问题
LVIS数据集主要解决了实例分割中长尾分布导致的模型偏差问题。传统数据集往往忽略罕见类别,而LVIS通过均衡的类别采样和详尽的标注,使研究者能够系统评估模型对低频对象的识别能力。这不仅促进了长尾学习理论的发展,还为解决现实世界中类别不均衡的视觉任务提供了实证基础,推动了计算机视觉向更公平、更全面的方向发展。
衍生相关工作
围绕LVIS数据集,已衍生出多项经典研究工作。例如,长尾实例分割方法如EQLv2和Seesaw Loss,通过重新设计损失函数来缓解类别不均衡;此外,基于LVIS的基准测试催生了改进的检测架构如Mask R-CNN的变体,这些工作不仅提升了模型性能,还推动了数据增强、半监督学习等技术在实例分割中的应用,形成了持续的研究脉络。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作