five

HouseExpo|室内布局数据集|移动机器人数据集

收藏
arXiv2020-07-30 更新2024-06-21 收录
室内布局
移动机器人
下载链接:
https://github.com/TeaganLi/HouseExpo/
下载链接
链接失效反馈
资源简介:
HouseExpo数据集是由香港中文大学电子工程系创建的大型2D室内布局数据集,包含35,126个人工设计的2D房屋蓝图,总计252,550个房间,涵盖从单间工作室到多房间住宅的多样化结构。数据集通过PseudoSLAM模拟平台加速数据生成过程,提高训练效率。该数据集主要用于支持深度学习技术在移动机器人任务中的应用,如自主探索和避障,旨在通过模拟和真实世界实验验证数据集的有效性。
提供机构:
香港中文大学
创建时间:
2019-03-24
AI搜集汇总
数据集介绍
main_image_url
构建方式
HouseExpo数据集构建于SUNCG数据集之上,该数据集包含了45,622个手工设计的3D房屋模型。为了生成2D室内布局数据集,研究人员首先从SUNCG中提取3D结构模型,并获取地面截面和门截面。通过计算地面截面的轮廓,将外部填充为障碍物,从而得到室内布局。接着,移除门并在生成的布局中重新检查连通性,确保所有房间相互连接。最后,对墙壁进行细化,并裁剪图像以使房屋居中。为了减少冗余,研究人员通过计算像素差异来重新检查地图之间的相似性,并移除重复的元素。
使用方法
使用HouseExpo数据集时,用户可以将其导入到PseudoSLAM模拟平台中。PseudoSLAM是一个轻量级的模拟平台,它具有OpenAI Gym兼容的接口,可以模拟SLAM和导航过程。用户可以指定机器人配置、障碍物、分辨率、传感器范围等参数,以满足不同应用的需求。PseudoSLAM还可以生成障碍物,以增加训练样本的多样性。通过在模拟环境中训练模型,用户可以验证模型的有效性和泛化能力,并将学习到的策略转移到真实世界的机器人平台上。
背景与挑战
背景概述
随着人工智能领域的飞速发展,移动机器人在近年来越来越受到关注。然而,由于缺乏通用的实验平台,当前移动机器人的研究往往在手动设计的场景中进行评估。同时,随着深度学习技术的进步,一些研究人员试图将基于学习的方法应用于移动机器人任务,这需要大量的数据。为了满足这一需求,我们构建了HouseExpo,一个包含35,126个2D室内布局的大型数据集,总共包括252,550个房间。我们还开发了一个轻量级且高效的模拟平台PseudoSLAM,以加速数据生成过程,从而加快训练过程。在我们的实验中,我们构建了模型来从学习的角度解决避障和自主探索问题,并通过模拟和真实世界的实验验证了我们的模拟器和数据集的有效性。所有数据和代码都可在网上获取,我们希望HouseExpo和PseudoSLAM能满足数据需求,并使整个社区受益。
当前挑战
当前数据集和模拟器难以满足对大规模、多样化数据的需求。现有的2D环境数据集在规模和多样性方面有限,这可能会影响算法的性能。此外,模拟器在通过同时定位与建图(SLAM)构建地图的耗时较长,成为训练神经网络的瓶颈。这些问题促使我们开发了一个大型数据集HouseExpo和一个快速模拟平台PseudoSLAM,以提高训练效率。
常用场景
经典使用场景
HouseExpo数据集被广泛用于学习型算法在移动机器人领域的应用,特别是在障碍物规避和自主探索任务中。它提供了大规模的室内布局数据,使得研究人员可以训练深度强化学习模型,并在模拟环境中测试这些模型的有效性。PseudoSLAM模拟器与HouseExpo数据集结合,为移动机器人算法的开发提供了一个高效的训练平台。
解决学术问题
HouseExpo数据集解决了移动机器人领域学习型算法训练数据不足的问题。现有的数据集在规模和多样性上都有所限制,而HouseExpo数据集包含了大量的2D室内布局图,为深度学习模型提供了丰富的训练数据。此外,PseudoSLAM模拟器通过模拟SLAM过程,提高了训练效率,并减少了模拟与现实之间的差距,使得在模拟环境中训练的模型能够更好地迁移到真实世界中。
实际应用
HouseExpo数据集和PseudoSLAM模拟器在实际应用中具有重要的价值。例如,在智能家居环境中,移动机器人可以利用这些工具进行自主导航和室内清洁。此外,这些工具还可以用于商场、博物馆等公共场所的移动机器人导航和路径规划。
数据集最近研究
最新研究方向
HouseExpo数据集为基于学习的移动机器人算法提供了一个大规模的二维室内布局数据集,包含35,126个2D平面图,总计252,550个房间。结合PseudoSLAM模拟平台,该数据集有助于加速数据生成过程,提高训练效率。近期研究主要关注在移动机器人领域应用深度学习技术,特别是在自主探索和避障任务中。通过在模拟和真实世界中进行的实验,验证了HouseExpo和PseudoSLAM的有效性,展示了学习策略在现实环境中的泛化能力。未来研究方向包括如何优化利用拓扑信息,以及将控制层次结构融入学习过程,以实现更高效和复杂的机器人任务。
相关研究论文
  • 1
    HouseExpo: A Large-scale 2D Indoor Layout Dataset for Learning-based Algorithms on Mobile Robots香港中文大学 · 2020年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录

中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2023)

地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2023年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2023)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心 收录