five

SUN RGB-D|计算机视觉数据集|机器学习数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
计算机视觉
机器学习
下载链接:
https://opendatalab.org.cn/OpenDataLab/SUN_RGB-D
下载链接
链接失效反馈
资源简介:
SUN RGBD 数据集包含 10335 个房间场景的真实 RGB-D 图像。每个 RGB 图像都有对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
提供机构:
OpenDataLab
创建时间:
2022-05-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
SUN RGB-D数据集的构建基于深度传感器和RGB摄像头的同步采集,涵盖了室内场景的广泛类别。通过使用Kinect v2、Asus Xtion Pro和RealSense等设备,数据集捕捉了超过10,000个3D场景,每个场景均包含RGB图像、深度图、表面法线图以及物体边界框信息。这些数据经过精细标注,确保了高精度的场景理解和物体识别。
使用方法
SUN RGB-D数据集适用于多种计算机视觉任务,包括但不限于物体检测、场景分类和语义分割。研究者可以通过加载数据集中的RGB图像、深度图和表面法线图,结合物体边界框和语义标签,进行模型的训练和评估。数据集的多模态特性使其在深度学习和计算机视觉研究中具有广泛的应用前景。
背景与挑战
背景概述
SUN RGB-D数据集,由Xiao等人于2015年创建,是计算机视觉领域中一个重要的三维场景理解基准。该数据集包含了超过10,000张RGB-D图像,每张图像均附有详细的语义标注,涵盖了室内和室外场景的广泛类别。主要研究人员来自普林斯顿大学和斯坦福大学,他们的核心研究问题是如何利用RGB-D数据进行精确的三维场景解析和物体识别。SUN RGB-D的发布极大地推动了三维视觉和语义分割技术的发展,为后续研究提供了丰富的数据资源和基准测试平台。
当前挑战
尽管SUN RGB-D数据集在三维场景理解领域具有重要地位,但其构建和应用过程中仍面临诸多挑战。首先,数据集的构建需要处理大量复杂的RGB-D图像,确保深度信息的准确性和一致性,这是一个技术上的难题。其次,语义标注的精细化要求高,涉及多层次的物体识别和场景解析,这对标注工具和方法提出了高要求。此外,如何有效利用RGB-D数据进行深度学习模型的训练,以提高场景理解的准确性和鲁棒性,也是当前研究的一个关键挑战。
发展历史
创建时间与更新
SUN RGB-D数据集于2015年首次发布,由普林斯顿大学和斯坦福大学的研究团队共同创建。该数据集在2017年进行了重要更新,增加了更多的场景和标注信息,以满足日益增长的计算机视觉研究需求。
重要里程碑
SUN RGB-D数据集的发布标志着三维场景理解领域的一个重要里程碑。其首次整合了RGB-D图像与三维场景结构信息,为深度学习算法在场景识别、物体检测和语义分割等任务中的应用提供了丰富的数据资源。2017年的更新进一步扩展了数据集的规模和多样性,显著提升了其在实际应用中的价值和影响力。
当前发展情况
当前,SUN RGB-D数据集已成为计算机视觉和机器人学领域的重要基准数据集之一。它不仅推动了三维场景理解技术的发展,还为多模态数据融合研究提供了宝贵的资源。随着深度学习技术的不断进步,SUN RGB-D数据集的应用范围也在不断扩大,从智能家居到自动驾驶,其贡献日益显著。未来,随着更多研究者对其进行深入挖掘和应用,SUN RGB-D数据集将继续在推动相关领域的前沿研究中发挥关键作用。
发展历程
  • SUN RGB-D数据集首次发表,由Xiao等人提出,旨在提供一个包含RGB-D图像的大规模数据集,用于场景理解研究。
    2015年
  • SUN RGB-D数据集首次应用于深度学习模型训练,特别是在场景分类和物体检测任务中,展示了其在计算机视觉领域的潜力。
    2016年
  • 随着深度学习技术的进步,SUN RGB-D数据集被广泛用于开发和验证新的三维物体检测和场景解析算法。
    2017年
  • SUN RGB-D数据集开始被集成到多个开源计算机视觉框架中,促进了其在学术界和工业界的应用。
    2018年
  • 研究者们利用SUN RGB-D数据集进行多模态学习研究,探索如何更有效地融合RGB和深度信息以提升模型性能。
    2019年
  • SUN RGB-D数据集在自动驾驶和机器人导航等实际应用中得到了进一步验证,展示了其在实际场景中的应用价值。
    2020年
  • 随着数据集的不断扩展和更新,SUN RGB-D继续在推动场景理解和三维视觉研究方面发挥重要作用。
    2021年
常用场景
经典使用场景
在计算机视觉领域,SUN RGB-D数据集以其丰富的三维场景信息和多模态数据而著称。该数据集广泛应用于场景理解、物体检测和语义分割等任务。通过整合RGB图像与深度信息,研究者能够更精确地分析场景中的物体位置和结构,从而提升算法的鲁棒性和准确性。
解决学术问题
SUN RGB-D数据集解决了传统RGB图像数据集在三维空间信息缺失的问题,为研究者提供了一个更为全面的数据平台。这不仅推动了三维物体检测和场景理解的研究进展,还为多模态数据融合提供了宝贵的实验基础。其丰富的标注信息和多样化的场景类型,极大地促进了相关领域算法的创新和优化。
实际应用
在实际应用中,SUN RGB-D数据集被广泛用于智能家居、机器人导航和增强现实等领域。例如,通过分析数据集中的深度信息,智能家居系统可以更准确地识别和定位房间内的物体,从而实现更智能化的控制。此外,机器人导航系统利用该数据集进行训练,能够更有效地避开障碍物,提升导航的精度和安全性。
数据集最近研究
最新研究方向
在计算机视觉领域,SUN RGB-D数据集因其丰富的三维空间信息和多模态数据而备受关注。最新研究方向主要集中在利用深度学习和多模态融合技术,提升场景理解与物体识别的准确性。研究者们通过结合RGB图像和深度信息,探索更高效的特征提取和融合方法,以应对复杂场景中的遮挡和光照变化。此外,该数据集还被广泛应用于增强现实、机器人导航和智能家居等前沿应用中,推动了相关技术的实际应用和产业化进程。
相关研究论文
  • 1
    SUN RGB-D: A RGB-D Scene Understanding Benchmark SuitePrinceton University · 2015年
  • 2
    3D Semantic Segmentation with Submanifold Sparse Convolutional NetworksStanford University · 2018年
  • 3
    Learning to Segment Every ThingFacebook AI Research · 2018年
  • 4
    DensePose: Dense Human Pose Estimation In The WildFacebook AI Research · 2018年
  • 5
    Deep Hough Voting for 3D Object Detection in Point CloudsStanford University · 2019年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

RFUAV

RFUAV数据集是由浙江科技大学信息科学与工程学院开发的高质量原始射频数据集,包含37种不同无人机的约1.3 TB原始频率数据。该数据集旨在解决现有无人机检测数据集类型单一、数据量不足、信号-to-噪声比(SNR)范围有限等问题,提供了丰富的SNR级别和用于特征提取的基准预处理方法及模型评估工具。数据集适用于射频无人机检测和识别,有助于推动相关技术的研究与应用。

arXiv 收录