LVIS

Hugging Face2024-07-06 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/harpreetsahota/LVIS

下载链接

链接失效反馈

官方服务：

资源简介：

LVIS-35k是一个包含35000个样本的FiftyOne数据集，主要用于对象检测任务。数据集的语言为英语，样本数量在10K到100K之间。

创建时间：

2024-07-06

原始信息汇总

LVIS-35k 数据集概述

基本信息

数据集名称: LVIS-35k
语言: 英文 (en)
数据规模: 10K<n<100K
任务类型: 目标检测 (object-detection)
标签: fiftyone, image, object-detection
数据集摘要: 包含35000个样本的FiftyOne数据集

数据集详情

描述: LVIS (发音为el-vis) 是一个用于大规模词汇实例分割的数据集，由Facebook AI的研究人员引入。
- 包含超过1000个对象类别的标注，涵盖164k张图像。
- 类别遵循自然长尾分布，包含少量常见类别和许多稀有类别。
- 可用于实例分割、语义分割和目标检测任务。
样本数量: 35000（完整数据集为164k图像）
创建者: Agrim Gupta, Piotr Dollár, Ross Girshick
资助方: Facebook AI Research (FAIR)
共享者: Harpreet Sahota, Voxel51的Hacker-in-Residence
许可证: Custom License

数据集来源

网站: https://www.lvisdataset.org/
代码库: https://github.com/lvis-dataset/lvis-api
论文: https://arxiv.org/abs/1908.03195

安装与使用

安装方法: bash pip install -U fiftyone
使用方法: python import fiftyone as fo import fiftyone.utils.huggingface as fouh dataset = fouh.load_from_hub("Voxel51/LVIS") session = fo.launch_app(dataset)

引用

bibtex @inproceedings{gupta2019lvis, title={{LVIS}: A Dataset for Large Vocabulary Instance Segmentation}, author={Gupta, Agrim and Dollar, Piotr and Girshick, Ross}, booktitle={Proceedings of the {IEEE} Conference on Computer Vision and Pattern Recognition}, year={2019} }

搜集汇总

数据集介绍

构建方式

LVIS数据集的构建始于对WordNet中8.8k个具体名词同义词集的筛选，经过多次迭代，最终确定了包含1000多个对象类别的词汇表。该数据集涵盖了164k张图像，并计划扩展至约200万高质量实例分割掩码。通过这种构建方式，LVIS旨在模拟自然语言中的长尾分布，即少数常见类别与大量稀有类别并存，从而为对象检测和分割任务提供更具挑战性的研究平台。

特点

LVIS数据集以其大规模和高精度著称，特别强调了对长尾分布对象类别的覆盖。数据集中的类别遵循自然的长尾分布，包含大量稀有类别，这对当前最先进的对象检测方法提出了挑战。此外，LVIS支持实例分割、语义分割和对象检测等多种任务，旨在推动研究社区关注长尾对象识别这一开放性问题。数据集的高质量标注和丰富的类别多样性使其成为计算机视觉领域的重要资源。

使用方法

使用LVIS数据集时，首先需安装FiftyOne库，通过简单的Python代码即可加载数据集。用户可以通过`fouh.load_from_hub`方法从Hugging Face Hub加载数据集，并利用FiftyOne提供的可视化工具进行数据探索和分析。此外，用户还可以根据需求调整加载参数，如`max_samples`，以控制加载的样本数量。LVIS的灵活性和易用性使其成为研究人员和开发者在对象检测和分割任务中的理想选择。

背景与挑战

背景概述

LVIS数据集由Facebook AI Research（FAIR）的研究人员Agrim Gupta、Piotr Dollár和Ross Girshick于2019年推出，旨在解决大规模词汇实例分割问题。该数据集包含超过1000个物体类别的标注，覆盖164,000张图像，并计划扩展至约200万高质量实例分割掩码。LVIS的类别分布遵循自然长尾分布，即少数常见类别和大量稀有类别并存，这对当前最先进的物体检测方法提出了挑战。LVIS的词汇表基于WordNet的8,800个具体名词同义词集进行迭代构建，最终筛选出适合的类别集合。该数据集不仅支持实例分割任务，还可用于语义分割和物体检测，推动了长尾物体识别领域的研究。

当前挑战

LVIS数据集的核心挑战在于其长尾分布的类别结构。大多数物体检测方法在处理常见类别时表现优异，但在面对稀有类别时性能显著下降。稀有类别的样本数量有限，导致模型难以从中学习到有效的特征表示。此外，构建过程中，研究人员需从大量候选类别中筛选出适合的词汇表，确保类别之间的区分度和标注质量。数据集的扩展计划也带来了标注一致性和数据管理的挑战，尤其是在处理数百万个实例分割掩码时，如何保持高质量标注成为关键问题。这些挑战促使研究者开发更鲁棒的模型，以应对长尾分布带来的复杂性。

常用场景

经典使用场景

LVIS数据集在计算机视觉领域中被广泛应用于实例分割任务，尤其是在处理大规模词汇对象识别时表现出色。该数据集包含了超过1000个对象类别的标注信息，涵盖了164k张图像，特别适合用于训练和评估模型在长尾分布数据上的表现。研究人员通常利用LVIS数据集来开发新的算法，以解决在稀有类别上的识别难题。

解决学术问题

LVIS数据集主要解决了大规模词汇实例分割中的长尾分布问题。传统的对象检测方法在面对稀有类别时表现不佳，而LVIS通过提供大量稀有类别的标注数据，帮助研究人员开发出能够更好地处理这些类别的模型。这不仅推动了实例分割技术的发展，还为解决长尾分布问题提供了新的研究方向。

衍生相关工作

LVIS数据集的发布催生了许多相关研究工作，特别是在长尾分布对象识别和实例分割领域。例如，基于LVIS数据集的研究提出了多种改进的实例分割算法，如基于注意力机制的模型和自监督学习方法。这些工作不仅提升了模型在稀有类别上的表现，还为未来的研究提供了新的思路和工具。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集