five

Voxel51/LVIS|实例分割数据集|对象检测数据集

收藏
hugging_face2024-07-08 更新2024-07-22 收录
实例分割
对象检测
下载链接:
https://hf-mirror.com/datasets/Voxel51/LVIS
下载链接
链接失效反馈
资源简介:
LVIS-35k是一个用于大规模词汇实例分割的数据集,由Facebook AI的研究人员引入。它包含超过1000个对象类别的注释,覆盖164k张图像。该数据集的目标是推动研究社区关注长尾对象识别的开放挑战。LVIS-35k可以用于实例分割、语义分割和对象检测任务。数据集的特点是遵循自然长尾分布,即少数常见类别和许多稀有类别,这对当前最先进的对象检测方法提出了挑战。数据集由Agrim Gupta、Piotr Dollár和Ross Girshick策划,由Facebook AI Research (FAIR)资助,由Voxel51的Hacker-in-Residence Harpreet Sahota共享,语言为英语,采用自定义许可证。

LVIS-35k is a FiftyOne managed image dataset containing 35,000 samples. This dataset is a subset of the LVIS dataset, primarily used for large vocabulary instance segmentation tasks. Introduced by researchers from Facebook AI, the LVIS dataset contains annotations for over 1000 object categories across 164k images. The dataset features a natural long-tail distribution, including some common categories and many rare ones with few training examples. The goal of the LVIS dataset is to address the challenge of long-tail object recognition and is applicable for instance segmentation, semantic segmentation, and object detection tasks. The dataset is funded by Facebook AI Research (FAIR) and curated by Agrim Gupta, Piotr Dollár, and Ross Girshick.
提供机构:
Voxel51
原始信息汇总

LVIS-35k 数据集概述

基本信息

  • 名称: LVIS-35k
  • 语言: 英语
  • 样本数量: 35,000
  • 大小类别: 10K < n < 100K
  • 任务类别: 目标检测
  • 标签: fiftyone, image, object-detection

数据集描述

  • 描述: LVIS (发音为 el-vis) 是一个用于大词汇量实例分割的数据集,由 Facebook AI 的研究人员引入。
    • 包含超过 1000 个对象类别的注释,涵盖 164,000 张图像。
    • 计划包含约 200 万个高质量的实例分割掩码。
    • 类别遵循自然的长尾分布,包含一些常见类别和许多罕见类别,这些罕见类别具有较少的训练样本。
    • 词汇是通过迭代构建的,从 WordNet 中的 8.8k 个具体名词同义词集开始,过滤到最终集合。
    • 可用于实例分割、语义分割和目标检测任务。
    • 旨在聚焦研究社区在长尾对象识别方面的开放挑战。

数据集来源

  • 网站: https://www.lvisdataset.org/
  • 仓库: https://github.com/lvis-dataset/lvis-api
  • 论文: https://arxiv.org/abs/1908.03195

引用

bibtex @inproceedings{gupta2019lvis, title={{LVIS}: A Dataset for Large Vocabulary Instance Segmentation}, author={Gupta, Agrim and Dollar, Piotr and Girshick, Ross}, booktitle={Proceedings of the {IEEE} Conference on Computer Vision and Pattern Recognition}, year={2019} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
LVIS数据集的构建采取迭代筛选的方式,起始于WordNet中的8.8k个具体名词同义词集,经过精细筛选,最终形成包含超过1000个对象类别的数据集。该数据集覆盖了164k图像,并计划扩展至约200万高质量实例分割掩膜。其构建过程充分考虑了对象类别的长尾分布特性,旨在为罕见类别提供足够的训练样本,以挑战当前最先进的对象检测方法。
特点
LVIS数据集的特点在于其大规模、高质量,并且专注于长尾对象识别这一难题。数据集中的类别分布呈现自然的长尾形态,包含少量常见类别和大量罕见类别。这种分布对于提升低样本类别对象的检测与分割性能至关重要,为相关领域的研究提供了宝贵的资源。
使用方法
使用LVIS数据集,用户首先需要安装FiftyOne工具。通过FiftyOne提供的接口,用户可以轻松加载数据集并启动应用,进行实例分割、语义分割和对象检测等任务的研究。数据集加载后,可以利用FiftyOne的应用程序进行交互式探索,进一步理解数据集的结构和内容。
背景与挑战
背景概述
LVIS(Large Vocabulary Instance Segmentation)数据集,由Facebook AI的研究人员推出,旨在解决大规模词汇实例分割的难题。该数据集创建于2019年,由Agrim Gupta、Piotr Dollár和Ross Girshick等研究人员共同构建,得到了Facebook AI Research(FAIR)的资助。LVIS数据集涵盖了超过1000个对象类别,跨越164k图像,并计划扩展至约200万高质量实例分割掩膜。其类别分布呈自然长尾形态,对当前最先进的对象检测方法提出了挑战,特别是在低样本类别方面。LVIS的构建目标是引导研究界关注长尾对象识别这一开放性挑战,并可用于实例分割、语义分割和对象检测任务。
当前挑战
LVIS数据集在构建和应用过程中面临的挑战主要包括:如何有效处理长尾分布的数据,确保模型对少数样本类别的学习能力;如何在大规模数据集上保持高质量的数据标注;以及如何促进研究社区在长尾对象识别方面的进展。此外,数据集的构建还涉及从WordNet的8.8k具体名词同义词集合出发,迭代筛选至最终类别集的过程,这对数据集的构建提出了额外的挑战。
常用场景
经典使用场景
在计算机视觉领域,LVIS-35k数据集作为大型词汇实例分割的典范,其经典使用场景主要在于训练和评估面向长尾分布对象检测与分割的深度学习模型。该数据集通过提供35000个样本,涵盖了1000多个对象类别,为研究者提供了一个研究长尾分布问题的重要平台。
衍生相关工作
LVIS-35k数据集的推出,催生了一系列相关研究工作,如针对长尾分布的特定算法设计、模型训练策略优化,以及性能评估标准的研究。这些工作不仅深化了对长尾分布数据理解,也促进了计算机视觉领域技术的发展。
数据集最近研究
最新研究方向
近期,LVIS-35k数据集在大型词汇实例分割领域的研究方向备受关注。该数据集针对当前最先进的对象检测方法在处理尾部类别时的困难,提供了超过1000个对象类别的标注,以及164k图像的实例分割掩码,旨在推动长尾对象识别这一开放性挑战的研究。研究人员正利用LVIS数据集探索如何更有效地训练模型以识别那些样本数量较少的罕见类别,以期提升模型在实例分割、语义分割和对象检测任务中的性能。该数据集的深入研究不仅对计算机视觉领域具有重要意义,也为人工智能在现实世界应用中的发展提供了强有力的数据支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录