MFE-ETP|具身人工智能数据集|任务规划数据集
收藏数据集概述
标题
MFE-ETP: An Embodied Task Planning Benchmark for Multi-modal Foundation Models
作者
- Min Zhang<sup>1</sup>
- Jianye Hao<sup>1</sup>
- Xian Fu<sup>1</sup>
- Peilong Han<sup>1</sup>
- Hao Zhang<sup>1</sup>
- Lei Shi<sup>1</sup>
- Hongyao Tang<sup>2</sup>
机构
- <sup>1</sup>Tianjin University
- <sup>2</sup>Montreal Institute of Learning Algorithms (MILA)
摘要
近年来,多模态基础模型(MFMs)和具身人工智能(EAI)以空前的速度并行发展,两者的结合引起了AI研究界的广泛关注。本工作旨在深入全面地评估MFMs在具身任务规划方面的性能,以揭示其在该领域的功能和局限性。为此,基于具身任务规划的特点,我们首先开发了一个系统的评估框架,该框架涵盖了MFMs的四个关键能力:对象理解、时空感知、任务理解和具身推理。随后,我们提出了一个新的基准,名为MFE-ETP,其特点是任务场景复杂多变、任务类型典型多样、任务实例难度不一,以及从多模态问题回答到具身任务推理的丰富测试案例类型。最后,我们提供了一个简单易用的自动评估平台,使多个MFMs能够在提出的基准上进行自动化测试。通过使用该基准和评估平台,我们评估了几个最先进的MFMs,发现它们与人类水平的性能存在显著差距。MFE-ETP是一个高质量、大规模且具有挑战性的基准,与现实世界任务相关。
相关链接

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
Duke Lung Cancer Screening Dataset 2024 (DLCS 2024)
Duke Lung Cancer Screening Dataset 2024 (DLCS 2024) 是一个用于肺癌风险分类研究的数据集,随着低剂量胸部CT筛查项目的普及,该数据集变得越来越重要。
github 收录