PARTNR
收藏PARTNR: A Benchmark for Planning and Reasoning in Embodied Multi-Agent Tasks
概述
- 数据集名称: PARTNR
- 领域: 具身多智能体任务中的规划与推理
- 主要抽象:
- Agent: 代表机器人或人类,能够在环境中行动。
- Planner: 代表集中式和分散式规划器。
- Tool: 代表使智能体能够感知或与环境交互的抽象。
- Skill: 低级技能,智能体可以使用这些技能与环境交互。
- 数据集生成: 使用大型语言模型(LLM)生成PARTNR数据集。
代码组织
- habitat-llm:
- Agent: 代表机器人或人类。
- Tools: 代表感知或与环境交互的抽象。
- Planner: 代表集中式和分散式规划器。
- LLM: 包含Llama和GPT API的抽象。
- WorldGraph: 包含表示房间、家具、物体的层次世界图。
- Perception: 包含模拟感知管道,将局部检测发送到世界模型。
- Examples: 包含演示和评估程序,用于展示或分析规划器的性能。
- EvaluationRunner: 代表运行规划器的抽象。
- Conf: 包含所有类的hydra配置文件。
- Utils: 包含代码库中所需的各类实用方法。
- Tests: 包含单元测试。
- scripts:
- hitl_analysis: 包含分析和重放人机交互轨迹的脚本。
- prediviz: 包含PARTNR任务的可视化和注释工具。
信息流
- EnvironmentInterface: 读取每个智能体的观察结果并发送给感知模块。
- Perception Module: 处理观察结果并更新世界图。
- Planner: 使用世界图和任务描述选择工具与环境交互。
安装
- 参考INSTALLATION.md进行安装。
快速开始
- 数据集分割:
train_2k,val,train,val_mini - 示例:
-
Decentralized Multi Agent React Summary: bash python -m habitat_llm.examples.planner_demo --config-name baselines/decentralized_zero_shot_react_summary.yaml habitat.dataset.data_path="data/datasets/partnr_episodes/v0_0/val_mini.json.gz" evaluation.agents.agent_0.planner.plan_config.llm.inference_mode=hf evaluation.agents.agent_1.planner.plan_config.llm.inference_mode=hf evaluation.agents.agent_0.planner.plan_config.llm.generation_params.engine=meta-llama/Meta-Llama-3-8B-Instruct evaluation.agents.agent_1.planner.plan_config.llm.generation_params.engine=meta-llama/Meta-Llama-3-8B-Instruct
-
Centralized Multi Agent React Summary: bash python -m habitat_llm.examples.planner_demo --config-name baselines/centralized_zero_shot_react_summary.yaml habitat.dataset.data_path="data/datasets/partnr_episodes/v0_0/val_mini.json.gz" evaluation.planner.plan_config.llm.inference_mode=hf evaluation.planner.plan_config.llm.generation_params.engine=meta-llama/Meta-Llama-3-8B-Instruct
-
Single Agent React Summary: bash python -m habitat_llm.examples.planner_demo --config-name baselines/single_agent_zero_shot_react_summary.yaml habitat.dataset.data_path="data/datasets/partnr_episodes/v0_0/val_mini.json.gz" evaluation.agents.agent_0.planner.plan_config.llm.inference_mode=hf evaluation.agents.agent_0.planner.plan_config.llm.generation_params.engine=meta-llama/Meta-Llama-3-8B-Instruct
-
Heuristic Planner: bash python -m habitat_llm.examples.planner_demo --config-name baselines/heuristic_full_obs.yaml habitat.dataset.data_path="data/datasets/partnr_episodes/v0_0/val_mini.json.gz"
-
计算结果
- 使用
python scripts/read_results.py <output_dir>/<dataset_name>检查运行进度和结果。
测试集
- 使用以下命令测试数据集的可运行性和初始步骤的成功率: bash HYDRA_FULL_ERROR=1 python -m habitat_llm.examples.verify_episodes --config-name examples/planner_multi_agent_demo_config.yaml hydra.run.dir="." evaluation=centralized_evaluation_runner_multi_agent habitat.dataset.data_path="data/datasets/partnr_episodes/v0_0/val_mini.json.gz" mode=data world_model.partial_obs=False evaluation.type="centralized" num_proc=5
许可证
- 许可证: MIT

- 1PARTNR: A Benchmark for Planning and Reasoning in Embodied Multi-agent TasksFAIR Meta · 2024年



