five

YCB-Video|计算机视觉数据集|姿态估计数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
计算机视觉
姿态估计
下载链接:
https://opendatalab.org.cn/OpenDataLab/YCB-Video
下载链接
链接失效反馈
资源简介:
YCB-视频数据集是用于6D对象姿态估计的大规模视频数据集。PoseCNN论文中提供了此数据集,以验证对称性,严重遮挡和姿势估计中的其他问题。 该数据集提供了来自YCB数据集的21个对象的精确6D姿势,这些对象出现在92个视频中,整个数据集包含133,827帧。
提供机构:
OpenDataLab
创建时间:
2023-04-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
YCB-Video数据集的构建基于对YCB对象集的广泛视频捕捉。该数据集通过使用高分辨率摄像机在多种光照条件和背景设置下,对21种日常物品进行多角度拍摄,从而生成丰富的视觉数据。视频帧经过精细标注,包括物体边界框、3D模型对齐信息以及深度图,确保了数据的高质量和多样性。
使用方法
YCB-Video数据集适用于多种计算机视觉任务,如物体检测、姿态估计和场景理解。研究者可以通过加载视频帧和相应的标注信息,进行模型训练和验证。数据集的3D模型信息可以用于生成合成数据,增强模型的泛化能力。此外,视频序列的时间连续性为研究动态场景提供了宝贵的资源。
背景与挑战
背景概述
YCB-Video数据集由耶鲁大学、卡内基梅隆大学和加州大学伯克利分校的研究团队于2017年联合发布,旨在推动机器人视觉与抓取任务的研究。该数据集包含了21种日常物品的RGB-D视频序列,这些物品涵盖了从简单几何形状到复杂形状的广泛范围。通过提供高质量的视觉数据,YCB-Video数据集为研究人员提供了一个标准化的测试平台,以评估和改进机器人系统在复杂环境中的物体识别和抓取能力。这一数据集的发布极大地促进了机器人技术的发展,特别是在增强现实和自动化制造领域。
当前挑战
YCB-Video数据集在构建过程中面临了多项挑战。首先,确保每个视频序列中的物体姿态和光照条件多样化,以模拟真实世界中的复杂环境,是一项技术难题。其次,数据集需要处理不同材质和颜色的物体,这对图像处理算法提出了高要求。此外,数据集的标注工作也极为繁琐,需要精确地标记每个物体的边界框和三维姿态,以确保数据的准确性和可用性。最后,如何在保持数据多样性的同时,确保数据集的规模和质量,也是一项重要的挑战。
发展历史
创建时间与更新
YCB-Video数据集由Krishna等人于2017年创建,旨在为机器人视觉和物体识别研究提供一个标准化的测试平台。该数据集自创建以来,未有公开的更新记录。
重要里程碑
YCB-Video数据集的创建标志着机器人视觉领域的一个重要里程碑。它包含了21个日常物品的RGB-D视频序列,这些物品来自YCB对象集,涵盖了从简单到复杂的各种形状和纹理。数据集的发布促进了基于深度学习的物体识别和姿态估计算法的发展,特别是在多物体和复杂背景下的应用。此外,YCB-Video还引入了新的评估指标,如ADD-S和ADD-A,这些指标在后续的研究中被广泛采用,推动了该领域的标准化进程。
当前发展情况
当前,YCB-Video数据集已成为机器人视觉和计算机视觉领域的一个基准数据集,被广泛用于评估和比较不同算法的性能。随着深度学习技术的不断进步,研究人员利用YCB-Video数据集开发了更高效和准确的物体识别和姿态估计模型。此外,该数据集还激发了大量关于多物体场景下物体识别和姿态估计的研究,推动了相关技术的实际应用,如家庭服务机器人和自动化仓储系统。尽管YCB-Video数据集自创建以来未有更新,但其对学术研究和工业应用的深远影响仍在持续。
发展历程
  • YCB-Video数据集首次发表,由美国卡内基梅隆大学和加州大学伯克利分校的研究团队共同发布。该数据集主要用于三维物体识别和姿态估计的研究。
    2017年
  • YCB-Video数据集首次应用于国际计算机视觉与模式识别会议(CVPR)上的相关研究,展示了其在实际应用中的潜力。
    2018年
  • YCB-Video数据集被广泛应用于多个国际顶级会议和期刊,如ICCV和TPAMI,进一步验证了其在三维视觉领域的价值。
    2019年
  • YCB-Video数据集的扩展版本发布,增加了更多的物体类别和场景,提升了数据集的多样性和复杂性。
    2020年
  • YCB-Video数据集被用于多个工业应用,如机器人抓取和自动化生产线,展示了其在实际工业环境中的应用前景。
    2021年
常用场景
经典使用场景
在计算机视觉领域,YCB-Video数据集以其丰富的多对象场景和高质量的标注数据,成为物体识别与姿态估计任务的经典基准。该数据集包含了21种日常物品在不同光照条件和背景下的视频序列,为研究人员提供了一个全面且多样化的实验平台。通过分析这些视频数据,研究者可以开发和验证物体检测、分割以及三维姿态估计算法,从而推动相关技术的发展。
解决学术问题
YCB-Video数据集在解决物体识别与姿态估计的学术研究问题中发挥了关键作用。其多样的场景和精确的标注数据,使得研究人员能够深入探讨复杂环境下的物体识别难题,如遮挡、光照变化和背景干扰等。此外,该数据集还促进了三维姿态估计技术的发展,为实现高精度的物体定位和姿态预测提供了宝贵的实验数据。这些研究成果不仅提升了学术界对物体识别与姿态估计的理解,也为实际应用奠定了坚实的基础。
实际应用
在实际应用中,YCB-Video数据集为机器人视觉、增强现实和智能家居等领域提供了重要的技术支持。例如,在机器人视觉系统中,利用该数据集训练的模型可以实现对日常物品的精确识别和抓取,从而提高机器人的操作效率和灵活性。在增强现实应用中,基于该数据集的姿态估计技术可以实现对虚拟物体在现实世界中的精准定位和渲染,提升用户体验。此外,智能家居系统也可以通过该数据集优化物体识别算法,实现更智能的家居管理和控制。
数据集最近研究
最新研究方向
在计算机视觉领域,YCB-Video数据集因其丰富的多对象场景和高质量的标注数据,成为研究三维物体识别和姿态估计的重要资源。近期,该数据集被广泛应用于深度学习模型的训练和评估,特别是在复杂背景下的物体检测和姿态预测任务中。研究者们通过引入多视角图像和深度信息,提升了模型在实际应用中的鲁棒性和准确性。此外,结合强化学习和生成对抗网络(GANs)的方法,也在该数据集上取得了显著进展,为实现更智能的机器人操作和环境感知提供了新的思路。
相关研究论文
  • 1
    YCB-Video: A Synthetic Video Dataset for Object Recognition and Pose EstimationUniversity of California, Berkeley · 2017年
  • 2
    PVNet: Pixel-wise Voting Network for 6DoF Pose EstimationShanghai Jiao Tong University · 2019年
  • 3
    DenseFusion: 6D Object Pose Estimation by Iterative Dense FusionStanford University · 2019年
  • 4
    CDPN: Coordinates-Based Disentangled Pose Network for Real-Time RGB-Based 6-DoF Object Pose EstimationTsinghua University · 2020年
  • 5
    HybridPose: 6D Object Pose Estimation under Hybrid RepresentationsUniversity of California, Berkeley · 2020年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

Open Power System Data

Open Power System Data is a free-of-charge data platform dedicated to electricity system researchers. We collect, check, process, document, and publish data that are publicly available but currently inconvenient to use. The project is a service provider to the modeling community: a supplier of a public good. Learn more about its background or just go ahead and explore the data platform.

re3data.org 收录

Desert Knowledge Australia Solar Centre PV Power Data

该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据,包括有功功率(AP,kW)、历史温度(T,℃)、相对湿度(RH,%)、全球水平辐照度(GHI,Wh/m²)和漫射水平辐照度(DHI,Wh/m²)。

github 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录