five

CORe50|连续对象识别数据集|机器人视觉数据集

收藏
arXiv2017-05-10 更新2024-06-21 收录
连续对象识别
机器人视觉
下载链接:
http://vlomonaco.github.io/core50
下载链接
链接失效反馈
资源简介:
CORe50是一个专为连续对象识别设计的数据集,由博洛尼亚大学的计算机科学与工程系创建。该数据集包含50个家用物品,分为10个类别,共有164,866张128×128像素的RGB-D图像。数据收集于11个不同的会话中,包括8个室内和3个室外场景,每个会话都记录了每个对象的视频。CORe50的创建旨在支持连续学习研究,特别是在对象识别领域,解决新实例和新类别识别的挑战。数据集的应用领域包括机器人视觉等,旨在实现对象识别的连续学习和知识巩固。
提供机构:
计算机科学与工程系 - DISI 博洛尼亚大学
创建时间:
2017-05-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
CORe50数据集的构建方式,旨在解决高维数据流持续学习的挑战。该数据集包含了50个日常物品,分为10个类别,通过11个不同的采集会话记录,每个会话包含不同背景和光照条件下的物体视频。使用Kinect 2.0传感器记录,每个物体在每个会话中都有一个15秒的视频,共约300个RGB-D帧。为了简化后续处理,数据集采用了基于运动的追踪器,从每个会话的每个物体中提取出128x128像素的RGB-D图像。数据集分为训练集和测试集,训练集由8个会话组成,测试集由3个会话组成,以平衡室内外、持物手和背景复杂性。
使用方法
CORe50数据集的使用方法包括以下步骤:1. 数据集下载和解压;2. 选择合适的机器学习模型,例如CNN;3. 使用训练集进行模型训练,可以选择从头开始训练、使用预训练模型微调或结合SVM进行特征提取;4. 在测试集上评估模型性能,可以通过融合相邻帧的置信度来提高分类精度;5. 根据需要调整模型参数和训练策略,以适应不同的持续学习场景,例如新实例、新类别或新实例和类别。
背景与挑战
背景概述
在现实世界的物体识别应用中,如机器人视觉,连续学习是至关重要的。然而,现有的数据集和基准很少能够评估和比较新兴的连续学习方法。为了解决这个问题,Lomonaco和Maltoni在2017年提出了一个新的数据集和基准CORe50,专门设计用于连续物体识别。该数据集包含50个家庭物体,分为10个类别,并在11个不同的场景中进行收集,每个场景都有不同的背景和光照条件。CORe50数据集的创建旨在提供一个评估和比较连续学习方法的标准平台,这对于推动连续学习的理论研究和技术发展具有重要意义。
当前挑战
CORe50数据集的创建和连续学习方法的评估面临着一些挑战。首先,连续学习领域的问题挑战包括如何处理新实例(NI)、新类别(NC)以及新实例和新类别(NIC)等场景。其次,构建数据集的过程中,如何确保数据集的多样性和复杂性,以便更好地模拟现实世界的物体识别场景,是一个重要的挑战。此外,在连续学习方法的评估中,如何选择合适的基准方法和评估指标,以准确反映连续学习方法的性能,也是一个需要解决的挑战。
常用场景
经典使用场景
CORe50数据集作为持续物体识别领域的一个新基准,旨在评估和比较连续学习技术。它特别设计用于模拟真实世界中的物体识别应用场景,如机器人视觉,其中连续学习至关重要。CORe50数据集包含50个家庭物品,分为10个类别,每个物品有11个不同的采集会话,涵盖了不同的背景、光照和视角。该数据集支持三种连续学习场景:新实例(NI)、新类别(NC)和新实例与类别(NIC)。CORe50数据集的经典使用场景包括评估和比较不同连续学习场景下的模型性能,以及开发和测试新的连续学习技术。
解决学术问题
CORe50数据集解决了持续学习中的灾难性遗忘问题,这是当前人工智能研究中的一个重要挑战。通过提供一个包含多个视角和会话的物体识别数据集,CORe50数据集使得研究人员能够评估和比较不同的连续学习技术,并找到解决灾难性遗忘问题的有效方法。此外,CORe50数据集还解决了持续学习中的其他问题,如如何有效地更新模型以适应新的数据,以及如何保持模型在多个任务上的性能。CORe50数据集的意义和影响在于它为持续学习研究提供了一个新的基准,并促进了该领域的发展。
实际应用
CORe50数据集的实际应用场景包括机器人视觉、智能监控、自动驾驶汽车和增强现实等。在机器人视觉中,CORe50数据集可用于训练机器人识别和操作不同物体。在智能监控中,CORe50数据集可用于训练监控系统识别和跟踪不同物体。在自动驾驶汽车中,CORe50数据集可用于训练汽车识别和避免不同物体。在增强现实中,CORe50数据集可用于训练系统识别和交互不同物体。CORe50数据集的实际应用意义在于它为这些领域提供了一个新的数据集,并促进了这些领域的发展。
数据集最近研究
最新研究方向
连续对象识别领域的前沿研究方向主要集中在如何处理连续数据流的高维学习,特别是在面临计算和存储限制时,如何避免灾难性遗忘。CORe50数据集的提出,正是为了满足这一研究需求。该数据集专门设计用于连续对象识别,提供了多种场景下的基准测试,包括新实例、新类别以及新实例和新类别的混合场景。这些场景对于评估和比较新兴的连续学习技术至关重要。目前,基于CORe50数据集的研究主要集中在开发有效的连续学习算法,以解决灾难性遗忘问题,并提高模型在连续学习任务中的性能。此外,研究还涉及如何利用深度信息、运动信息以及多模态数据来提升连续对象识别的准确性和鲁棒性。
相关研究论文
  • 1
    CORe50: a New Dataset and Benchmark for Continuous Object Recognition计算机科学与工程系 - DISI 博洛尼亚大学 · 2017年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

FROM-GLC全球30米地表覆盖数据集(2017)

该数据集中的数据获取自清华大学宫鹏团队。全球土地覆盖数据是了解人类活动与全球变化之间复杂互动关系的关键信息来源。FROM-GLC(更精细的全球土地覆盖观测和监测)是利用大地卫星专题成像仪(TM)和增强型专题成像仪(ETM+)数据制作的第一个30米分辨率的全球土地覆盖图。

国家对地观测科学数据中心 收录