five

hssd/hssd-hab|3D场景理解数据集|计算机视觉数据集

收藏
hugging_face2023-11-10 更新2024-03-04 收录
3D场景理解
计算机视觉
下载链接:
https://hf-mirror.com/datasets/hssd/hssd-hab
下载链接
链接失效反馈
资源简介:
Habitat合成场景数据集(HSSD)是一个人工创建的3D场景数据集,旨在更真实地模拟现实场景。该数据集包含211个场景和超过18000个真实世界物体的模型,涵盖了多样化的室内环境。数据集结构包括对象、舞台、场景等文件夹,每个文件夹包含相应的3D模型和配置文件。此外,数据集还支持Habitat 3.0的重新排列任务,提供了更新的碰撞器、调整和去杂乱的场景内容、接收器网格和接收器过滤器文件。
提供机构:
hssd
原始信息汇总

HSSD数据集概述

数据集基本信息

  • 名称: Habitat Synthetic Scenes Dataset (HSSD)
  • 类型: 3D场景数据集
  • 描述: HSSD是一个由人类作者创建的3D场景数据集,更接近真实场景。包含211个场景和超过18000个真实世界对象模型。
  • 许可证: CC BY-NC 4.0

数据集结构

├── objects │ ├── /.glb │ ├── /.collider.glb │ ├── /.filteredSupportSurface(.ply|.glb) │ ├── /.object_config.json ├── stages │ ├── *.glb │ ├── *.stage_config.json ├── scenes │ ├── *.scene_instance.json ├── scenes_uncluttered │ ├── *.scene_instance.json ├── scene_filter_files │ ├── *.rec_filter.json └── hssd-hab.scene_dataset_config.json └── hssd-hab-uncluttered.scene_dataset_config.json

主要组成部分

  • objects: 包含用于构建场景的独立对象的3D模型,包括配置文件、渲染资产、碰撞器资产和接收器网格资产。
  • stages: 在Habitat中,一个阶段是构成场景背景的静态网格组件集合(例如地板、墙壁、楼梯等)。
  • scenes: 一个场景是由静态阶段和可变数量的对象组成的单个3D世界。

支持的资产

  • hssd-hab-uncluttered.scene_dataset_config.json: 该SceneDataset配置文件聚合了调整后的非杂乱场景,用于重新排列任务。
  • scenes_uncluttered: 包含调整后的场景实例配置文件。
  • scene_filter_files: 场景过滤文件根据模拟启发式和手动编辑将场景中的可用接收器实例分为活动和非活动组,由RearrangeEpisodeGenerator用于构建有效的RearrangeEpisodeDatasets。

版本更新

  • v0.2.5: 添加了描述小对象支持表面的接收器网格,添加了支持模拟的碰撞器网格,添加了用于实体重新排列任务的调整和非杂乱场景,以及用于RearrangeEpisode生成的场景过滤文件。
  • v0.2.4: 重新压缩了多个对象GLB以保留PBR材料状态,添加了对象元数据和语义词汇表文件,以及训练/验证场景分割文件。
  • v0.2.3: 首次发布。
AI搜集汇总
数据集介绍
main_image_url
构建方式
HSSD数据集通过人工构建的方式,精心设计了一系列逼真的3D室内场景,涵盖了211个场景和超过18000个真实世界物体的模型。数据集的结构包括对象、场景、舞台等多个层次,每个层次都配备了详细的配置文件和支持文件,以确保数据的高质量和易用性。此外,数据集还特别为Habitat 3.0的重新排列任务进行了优化,提供了去杂乱场景和支持表面的网格文件。
特点
HSSD数据集以其高度逼真的3D场景和丰富的物体模型著称,特别适合用于具身智能体的训练和测试。数据集中的每个场景都经过精心设计,以模拟真实世界的室内环境,同时提供了详细的配置文件和网格文件,支持复杂的仿真任务。此外,数据集还包含了去杂乱场景和重新排列任务所需的特殊配置,使其在具身AI领域具有广泛的应用潜力。
使用方法
使用HSSD数据集时,首先需要安装Habitat-Sim和Habitat-Lab,这两个工具分别用于场景的加载和具身AI任务的执行。通过Habitat-Sim的交互式查看器,用户可以加载并浏览数据集中的场景。对于具身AI任务的定义、训练和性能评估,Habitat-Lab提供了高层次的模块化支持。用户可以根据具体任务需求,选择合适的场景和配置,进行实验和测试。
背景与挑战
背景概述
Habitat Synthetic Scenes Dataset (HSSD) 是由3DLG-HCVC团队开发的一个高质量3D场景数据集,旨在为具身智能(Embodied AI)研究提供更贴近真实环境的虚拟场景。该数据集于2022年首次发布,包含211个精心设计的室内场景和超过18000个真实世界物体的3D模型。HSSD的核心研究问题在于如何通过高保真的虚拟环境模拟真实世界的复杂性,从而支持智能体在虚拟空间中的导航、物体重排等任务。该数据集在具身智能领域具有重要影响力,为研究者提供了一个标准化的测试平台,推动了智能体在复杂环境中的学习和适应能力。
当前挑战
HSSD数据集在构建和应用过程中面临多重挑战。首先,如何确保3D场景的高保真度和多样性是一个关键问题,这要求数据集在物体建模、材质渲染和场景布局上达到极高的精度。其次,数据集的设计需要支持复杂的具身智能任务,如物体重排和导航,这对场景的物理属性和交互逻辑提出了更高要求。此外,数据集的构建过程中还面临技术挑战,例如如何高效压缩和存储大规模3D模型,以及如何优化场景加载和渲染性能以适应实时模拟需求。这些挑战不仅影响了数据集的构建效率,也对后续的研究应用提出了更高的技术要求。
常用场景
经典使用场景
HSSD数据集在3D场景重建和具身智能(Embodied AI)领域具有广泛的应用。其经典使用场景包括在Habitat模拟器中加载和渲染高度逼真的室内场景,用于训练和测试智能体在复杂环境中的导航、物体重排等任务。通过提供多样化的场景和物体模型,HSSD能够支持研究人员在虚拟环境中模拟真实世界的交互,从而提升智能体的环境适应能力。
实际应用
HSSD数据集的实际应用场景主要集中在智能家居、服务机器人以及虚拟现实领域。例如,在智能家居中,HSSD可以用于训练服务机器人在复杂室内环境中执行物体搬运、整理等任务。在虚拟现实领域,HSSD的高质量3D场景能够为沉浸式体验提供逼真的环境支持。此外,HSSD还可用于自动驾驶模拟器中,帮助开发车辆在复杂城市环境中的导航能力。
衍生相关工作
HSSD数据集推动了具身智能领域的多项经典研究工作。基于HSSD,研究人员开发了多种智能体训练框架,如Habitat-Lab,用于导航、物体重排和指令跟随等任务。此外,HSSD还为场景理解、物体识别和多模态感知等研究提供了丰富的数据支持。相关研究不仅提升了智能体在虚拟环境中的表现,还为真实世界中的机器人应用奠定了技术基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国行政区划shp数据

   中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。   中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。

CnOpenData 收录

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)

中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录