EmbodiedCity

Name: EmbodiedCity
Creator: 清华大学
Published: 2024-10-13 01:49:26
License: 暂无描述

arXiv2024-10-13 更新2024-10-16 收录

下载链接：

https://embodied-city.fiblab.net

下载链接

金山云加速下载

链接失效反馈

官方服务：

资源简介：

EmbodiedCity是由清华大学构建的一个用于评估具身智能在真实城市环境中表现的基准平台。该数据集基于北京市的一个商业区，构建了高度逼真的3D模拟环境，包含真实的街道、建筑、城市元素、行人和交通流量。数据集结合了历史收集的真实世界交通数据和模拟算法，模拟了行人和车辆的流动。数据集创建过程中，详细构建了城市建筑的3D模型，并提供了完整的输入输出接口，使具身智能代理能够轻松获取任务需求和环境观察，并进行决策和性能评估。该数据集主要应用于具身智能的评估和训练，旨在解决具身智能在开放户外城市环境中的感知、规划和行动能力问题。

EmbodiedCity is a benchmark platform developed by Tsinghua University for evaluating the performance of embodied intelligence in real-world urban environments. This dataset is constructed based on a commercial district in Beijing, featuring highly realistic 3D simulated environments that include authentic streets, buildings, urban elements, pedestrians, and traffic flows. It combines historically collected real-world traffic data and simulation algorithms to replicate the movement patterns of pedestrians and vehicles. During the development of this dataset, detailed 3D models of urban buildings were built, and complete input-output interfaces were provided, allowing embodied AI agents to easily acquire task requirements and environmental observations, as well as conduct decision-making and performance evaluation. This dataset is mainly applied to the evaluation and training of embodied intelligence, with the objective of addressing the challenges related to the perception, planning and action capabilities of embodied intelligence in open outdoor urban environments.

提供机构：

清华大学

创建时间：

2024-10-13

搜集汇总

数据集介绍

构建方式

EmbodiedCity数据集的构建基于一个高度真实的3D模拟环境，该环境以中国最大城市之一的北京的一个商业区为蓝本，细致地重建了街道、建筑、城市元素、行人和交通。通过结合历史收集的真实世界交通数据和模拟算法，实现了对行人和车辆流动的高保真模拟。此外，设计了一系列涵盖不同EmbodiedAI能力的评估任务，并提供了一套完整的输入输出接口，使具身代理能够轻松接收任务要求和当前环境观察，并做出决策和获得性能评估。

特点

EmbodiedCity数据集的显著特点在于其高度真实的3D城市环境，该环境不仅包括了建筑物和街道的精细建模，还模拟了动态元素如车辆和行人的行为。此外，数据集涵盖了多种EmbodiedAI任务，如场景描述、问答、对话、视觉语言导航和任务规划，这些任务全面覆盖了感知、推理和决策三个关键方面。

使用方法

EmbodiedCity数据集的使用方法包括通过提供的Python客户端SDK和基于HTTP协议的Python代理服务器进行访问。用户可以通过这些接口控制具身代理在模拟环境中的行为，获取实时观察数据，并进行任务执行和性能评估。此外，数据集还提供了一个在线平台，支持最多8个代理的同时模拟和控制，用户可以通过键盘、网页GUI或在线Python代码编辑器来操作代理。

背景与挑战

背景概述

EmbodiedCity数据集由清华大学的一组研究人员于2024年构建，旨在为城市环境中的具身智能体提供一个基准平台。该数据集的核心研究问题是如何在真实世界的城市环境中评估和提升具身智能体的能力，包括感知、规划和行动。通过构建一个高度逼真的3D模拟环境，结合历史收集的数据和模拟算法，研究人员设计了一系列涵盖不同具身智能体能力的评估任务。这一研究不仅扩展了现有具身智能体的功能，还为人工通用智能的实际应用提供了更高的价值。

当前挑战

EmbodiedCity数据集在构建过程中面临多个挑战。首先，创建一个高度逼真的城市环境需要精确的3D建模和复杂的数据处理，这要求研究人员具备高超的技术能力和丰富的资源。其次，设计涵盖多种具身智能体能力的评估任务需要深入理解智能体在城市环境中的行为和决策过程。此外，数据集的构建还需要大量的数据标注和人工校正，以确保评估任务的准确性和可靠性。最后，如何在模拟环境中有效地评估和提升具身智能体的能力，仍是一个开放的研究问题。

常用场景

经典使用场景

EmbodiedCity数据集的经典使用场景在于评估具身智能体在真实城市环境中的感知、规划和行动能力。通过构建高度逼真的3D模拟环境，结合历史收集的数据和仿真算法，该数据集能够模拟高保真的行人和车辆流动。此外，设计了一系列涵盖不同具身智能体能力的评估任务，包括场景描述、问答、对话、视觉语言导航和任务规划，从而全面测试智能体在开放户外城市环境中的多层次、多维度能力。

解决学术问题

EmbodiedCity数据集解决了现有具身智能体研究中主要集中在有限室内环境的问题，扩展了具身智能体的任务范围至户外城市环境。这一扩展不仅提升了现有具身智能体的能力水平，还具有更高的实际应用价值，支持更多潜在的人工通用智能应用。通过评估流行的大型语言模型，该数据集验证了其在不同维度和难度上的具身智能能力，为具身智能体的发展提供了重要的基准和参考。

衍生相关工作

EmbodiedCity数据集的发布催生了一系列相关研究工作，包括基于该数据集的具身智能体算法改进、多模态数据融合技术研究、以及具身智能体在城市环境中的应用探索。例如，有研究利用该数据集开发了新的视觉语言导航算法，显著提升了智能体在复杂城市环境中的导航能力。此外，还有研究探讨了如何利用该数据集进行跨模态学习，以提高智能体在不同感知模式下的综合表现。

以上内容由遇见数据集搜集并总结生成