five

电梯面板数据集

收藏
arXiv2021-03-22 更新2024-06-21 收录
下载链接:
https://github.com/zhudelong/elevator_button_recognition
下载链接
链接失效反馈
资源简介:
电梯面板数据集是由中国香港中文大学电子工程系创建的,包含3718张高质量面板图像和35100个按钮标签,旨在推动自主电梯操作的算法研究。数据集内容丰富,包括静态图像和视频序列,以及面板与视觉摄像机之间的姿态信息。创建过程中,部分图像通过网络爬虫收集,部分由作者自行拍摄并进行手动清理,确保样本多样性和无重复。该数据集主要应用于自主电梯操作领域,解决机器人跨楼层导航中的电梯按钮分割和识别问题。

The Elevator Panel Dataset was developed by the Department of Electronic Engineering, The Chinese University of Hong Kong. It contains 3,718 high-quality panel images and 35,100 button labels, and is intended to advance algorithmic research for autonomous elevator operation. The dataset has rich content, including static images, video sequences, and pose information between the elevator panel and the visual camera. During its construction, some images were collected through web crawling, while others were captured by the authors themselves and manually curated to ensure sample diversity and eliminate duplicates. This dataset is primarily applied in the field of autonomous elevator operation, addressing the issues of elevator button segmentation and recognition in robotic cross-floor navigation.
提供机构:
中国香港中文大学电子工程系
创建时间:
2021-03-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建方式包括从互联网上爬取静态图片以及通过机器人手臂上的RealSense深度相机D435捕获视频序列。静态图片涵盖了电梯内部和外部控制面板,而视频序列则展示了机器人手臂在预定义轨迹上移动时捕捉到的电梯面板。为了提高模型的泛化能力和鲁棒性,收集到的图片在面板类型、拍摄角度和光照条件方面具有多样性。此外,每个电梯面板上都贴有ArUco标记,用于确定相机和电梯面板之间的位姿信息,这为单图像位姿估计算法提供了基准。
特点
电梯面板数据集具有以下特点:首先,它是首个公开发布的大规模电梯面板数据集,包含高质量的3718张面板图片和35100个按钮标签,覆盖了现有的绝大多数按钮类别。其次,数据集包含静态图片和视频序列,以及面板和相机之间的位姿信息。第三,数据集中的按钮类别存在严重的类别不平衡问题,为了解决这个问题,将识别任务视为OCR问题,并设计了一个专门的字符字典,使得OCR框架可以识别数百个按钮类别而无需更改网络设计。最后,数据集还包含了多种基准指标和基于深度学习的网络实现,用于评估和比较电梯按钮分割和识别算法的性能。
使用方法
使用电梯面板数据集的方法包括以下步骤:首先,根据提供的基准指标和算法实现,评估和比较不同算法在按钮分割和识别任务上的性能。其次,根据实验结果选择合适的分割和识别算法,并在实际应用中部署。第三,利用数据集中的位姿信息,进行单图像位姿估计算法的研究和开发。最后,可以通过增加数据集的规模和多样性,进一步提高模型的泛化能力和鲁棒性。
背景与挑战
背景概述
电梯面板数据集的创建旨在应对COVID-19疫情对人类活动的限制,特别是对服务机器人进行楼层间导航的需求。该数据集于2021年3月发布,由香港中文大学电子工程系的Fang、Zhu、Ma、Pan和Liu等人主导。它包含了3,718张面板图像和35,100个按钮标签,旨在推动自主电梯操作领域的研究。该数据集的影响力体现在为研究人员提供了一个大规模的、公开可用的数据集,以验证和改进电梯按钮分割和识别算法,从而促进服务机器人自主楼层导航的发展。
当前挑战
电梯面板数据集所面临的挑战包括:1)解决领域问题的挑战,即电梯按钮分割和识别对于实现服务机器人自主楼层导航至关重要,但现有的数据集规模较小或不可用;2)构建过程中的挑战,包括数据收集、标注、处理和多样性保证等方面。数据集的构建过程中需要解决不同电梯面板类型、拍摄角度和光照条件下的按钮分割和识别问题,同时还需要处理类不平衡问题,例如一些按钮类别出现频率高,而其他类别则较少。为了解决这些挑战,研究人员采用了深度学习技术,并开发了基于深度学习的网络实现,以及评估指标,以促进未来研究的发展。
常用场景
经典使用场景
电梯面板数据集作为计算机视觉领域的一个重要数据集,其经典使用场景主要集中在自动驾驶电梯按钮分割和字符识别。该数据集提供了大规模的电梯面板图像,包括静态图像和视频序列,以及按钮标签和相机与电梯面板之间的位姿信息。通过训练深度学习模型,可以实现对电梯按钮的精确分割和字符识别,从而实现机器人对电梯的自主操作。
解决学术问题
电梯面板数据集解决了自动驾驶电梯操作中的一个重要问题,即电梯按钮的分割和字符识别。现有的方法大多依赖于人工设计特征或特定环境下的手工艺特征,无法广泛应用于各种场景。而电梯面板数据集提供了大规模的、多样化的数据,使得深度学习模型能够自动学习到电梯按钮的特征,提高了分割和识别的准确性和鲁棒性。
衍生相关工作
电梯面板数据集的发布,促进了自动驾驶电梯操作领域的研究。基于该数据集,研究人员提出了许多经典的分割和识别方法,如U-Net、FCN、DeepLab等,并进行了性能评估。此外,该数据集还衍生出一些相关的经典工作,如Ocr-Rcnn、Ocr-rcnn等,这些工作进一步推动了自动驾驶电梯操作领域的发展。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作