MIKASA-Base, MIKASA-Robo
收藏arXiv2025-02-15 更新2025-02-19 收录
下载链接:
https://sites.google.com/view/memorybenchrobots/
下载链接
链接失效反馈官方服务:
资源简介:
MIKASA是一套针对记忆强化学习算法的综合评估套件,包括MIKASA-Base和MIKASA-Robo两个部分。MIKASA-Base是一个统一的基准框架,用于评估记忆增强代理在各种场景下的性能;MIKASA-Robo包含32个精心设计的桌面机器人操作任务,这些任务按难度和配置模式不同分类,旨在评估机器人在实际场景中的记忆能力。
MIKASA is a comprehensive evaluation suite for memory reinforcement learning algorithms, consisting of two parts: MIKASA-Base and MIKASA-Robo. MIKASA-Base is a unified benchmark framework for evaluating the performance of memory-augmented agents across various scenarios; MIKASA-Robo contains 32 meticulously designed desktop robot manipulation tasks, which are categorized based on difficulty and configuration modes, aiming to evaluate the memory capabilities of robots in real-world scenarios.
提供机构:
莫斯科物理技术学院
创建时间:
2025-02-15
搜集汇总
数据集介绍

构建方式
MIKASA-Base和MIKASA-Robo数据集的构建旨在为强化学习中的记忆能力评估提供一个全面的基准。MIKASA-Base是一个基于Gymnasium的框架,通过诊断和复杂的环境来评估记忆增强代理。MIKASA-Robo则专注于桌面机器人操作中的记忆密集型任务,包含32个精心设计的任务,用于评估机器人操作中的记忆能力。
使用方法
使用MIKASA数据集的方法包括下载和安装数据集,然后使用Gymnasium API进行编程。用户可以选择不同的观察模式和奖励函数来训练和评估他们的强化学习代理。MIKASA-Robo还提供了多个训练模式和任务难度级别,以便研究人员可以根据需要调整任务复杂性。
背景与挑战
背景概述
MIKASA-Base 和 MIKASA-Robo 数据集由俄罗斯莫斯科 AIRI 研究所和 MIPT 研究中心的研究人员创建。该数据集旨在解决强化学习(RL)领域中记忆能力评估的标准化问题,尤其是在机器人桌面上操作时。MIKASA 数据集通过提供一个统一的基准,系统地评估记忆增强代理在多样化场景中的性能,从而推动记忆增强 RL 研究的进展,并为现实世界应用开发更可靠的系统奠定基础。
当前挑战
MIKASA 数据集面临的主要挑战包括:1) 缺乏评估代理记忆能力的通用基准,尤其是在具有时间空间依赖性的复杂任务中;2) 构建过程中遇到的挑战,例如设计能够模拟真实世界机器人操作复杂性的任务,以及确保这些任务能够有效地评估和区分不同类型的记忆能力。此外,数据集还需要解决在机器人操作中引入有意义的不完全观察性的挑战,以及开发能够评估代理在长期记忆和顺序决策方面的能力的任务。
常用场景
经典使用场景
MIKASA-Base 和 MIKASA-Robo 数据集主要用于评估强化学习(RL)智能体在记忆密集型任务中的能力。这些任务通常涉及部分可观测性、延迟奖励和长期信息保留等挑战,需要智能体利用历史信息来做出决策。MIKASA-Base 提供了一系列诊断性任务,而 MIKASA-Robo 则专注于桌面机器人操作任务,评估智能体在现实世界场景中的记忆能力。
解决学术问题
MIKASA-Base 和 MIKASA-Robo 解决了当前强化学习领域缺乏统一标准来评估智能体记忆能力的难题。现有的基准测试主要集中在特定的记忆利用方面,而 MIKASA 提供了一个全面的框架,涵盖了对象记忆、空间记忆、序列记忆和记忆容量四个基本类别,从而为记忆增强智能体的评估提供了系统性方法。
实际应用
MIKASA 数据集在实际应用中可用于开发更可靠、更通用的机器人系统。通过在 MIKASA-Base 和 MIKASA-Robo 上进行训练和评估,研究人员可以设计出能够在现实世界场景中有效处理部分可观测性和复杂决策任务的智能体。这对于推动机器人技术在家庭服务、工业自动化和医疗保健等领域的应用具有重要意义。
数据集最近研究
最新研究方向
针对记忆增强型强化学习(RL)在解决具有时间与空间依赖性的复杂任务中的能力评估,研究团队提出了MIKASA(Memory-Intensive Skills Assessment Suite for Agents)基准。该基准的三个主要贡献包括:(1)提出了一套全面的记忆密集型RL任务分类框架,(2)收集了MIKASA-Base,这是一个统一的基准,用于在各种场景中对记忆增强型智能体进行系统评估,(3)开发了MIKASA-Robo,这是一个包含32个精心设计的记忆密集型任务的基准,用于评估桌面机器人操作中的记忆能力。这些贡献为推进记忆RL研究提供了一个统一的框架,推动了更可靠系统的发展,以满足现实世界应用的需求。
相关研究论文
- 1Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning莫斯科物理技术学院 · 2025年
以上内容由遇见数据集搜集并总结生成



