LightPlan-40k

Name: LightPlan-40k
Creator: 中国科学院自动化研究所
Published: 2025-03-11 22:57:53
License: 暂无描述

arXiv2025-03-11 更新2025-03-13 收录

下载链接：

https://github.com/unira-zwj/LightPlanner

下载链接

链接失效反馈

官方服务：

资源简介：

LightPlan-40k数据集是由中国科学院自动化研究所构建的，包含40000个动作控制任务，每个任务包含2到13个动作步骤。该数据集用于训练LightPlanner-1.5B模型，旨在提升轻量级大型语言模型在复杂任务规划中的推理能力。数据集涵盖了从感知到动作的完整任务流程，为模型提供了丰富的动态参数调整和深度推理的实践场景。

The LightPlan-40k dataset is constructed by the Institute of Automation, Chinese Academy of Sciences. It contains 40,000 action control tasks, with each task consisting of 2 to 13 action steps. This dataset is used to train the LightPlanner-1.5B model, aiming to enhance the reasoning capabilities of lightweight large language models in complex task planning. The dataset covers the end-to-end task workflow from perception to action, providing the model with rich practical scenarios for dynamic parameter adjustment and in-depth reasoning.

提供机构：

中国科学院自动化研究所

创建时间：

2025-03-11

搜集汇总

数据集介绍

构建方式

LightPlan-40k数据集的构建旨在训练轻量级大型语言模型（LLMs）在复杂任务规划中的推理能力。该数据集包含40,000个行动控制，涉及2至13个行动步骤的任务。数据集的构建分为三个阶段：首先，专家手动注释了60个任务，包括30个不涉及逻辑语义推理的标准任务和30个涉及逻辑语义推理的任务，基于13个预定义的技能函数。其次，使用GPT-4对数据集进行了扩展，替换了任务对象，修改了感知结果，并调整了行动函数参数。最后，将每个行动控制步骤作为单独的数据实例进行转换，形成了包含40,000个决策样本的全面训练集。

特点

LightPlan-40k数据集的特点在于其多样性、复杂性和实用性。数据集中的任务涵盖了从简单到复杂的各种场景，包括简单的语义映射任务和动态语义推理任务。这些任务要求机器人能够理解和执行复杂的指令，如“抓取最大的积木并将其放入盒子中”。数据集的构建方式确保了模型的泛化能力和在实际环境中的高效性能。

使用方法

LightPlan-40k数据集可用于训练轻量级LLMs，以提高它们在复杂任务规划中的性能。训练模型时，可以使用动态参数化的技能控制策略，使LLMs能够根据任务需求动态选择和生成精确的参数。此外，数据集中的任务可以被用于评估模型的性能，包括任务成功率、任务完成率和推理时间。通过在边缘设备上运行模型，可以进一步验证模型的实时性能和资源消耗。

背景与挑战

背景概述

在机器人领域，任务规划是将高级语言指令转换为具体可执行动作的过程。近年来，大型语言模型（LLMs）因其强大的自然语言理解和生成能力而被越来越多地集成到机器人任务规划中。然而，高性能的LLMs通常具有庞大的参数规模和高计算需求，这在资源受限的边缘设备上部署和实时应用时受到限制。为了解决这个问题，轻量级LLMs应运而生，它们在显著降低计算资源消耗的同时保持了高性能，更适合嵌入式系统，如机器人。LightPlan-40k数据集正是在这一背景下创建的，旨在提高轻量级LLMs在复杂任务规划中的性能。该数据集由40,000个动作控制组成，涉及2到13个动作步骤的任务，为轻量级LLMs的训练提供了丰富的数据资源。

当前挑战

尽管轻量级LLMs在资源效率方面具有优势，但在复杂的任务规划中表现不佳，尤其是在需要多步逻辑推理和动态参数调整的任务中。这主要是因为轻量级LLMs的推理深度和灵活性有限，难以有效地处理复杂的语义关系和执行反馈。为了应对这些挑战，LightPlanner被提出，它通过充分利用轻量级LLMs的推理能力来提高它们在复杂任务规划中的性能。LightPlanner采用参数化函数调用机制来动态控制机器人的动作，通过动态参数推理来实现更精细的技能控制。此外，LightPlanner引入了分层深度推理机制，确保每个动作步骤的正确性和合理性。为了进一步提高长期任务规划效率，LightPlanner还集成了一个内存模块，以存储历史动作记录，从而减少对广泛上下文的需求。

常用场景

经典使用场景

LightPlan-40k数据集主要用于训练轻量级大型语言模型（LLM），以提升它们在复杂任务规划中的推理能力。该数据集包含了40,000个动作控制实例，涉及从2到13个动作步骤的任务。这些任务涵盖了简单的语义映射和动态语义推理，例如识别“最大的”块并将其放入盒中。LightPlan-40k数据集的构建使得轻量级LLM能够在资源受限的边缘设备上进行实时操作，同时保持高成功率。该数据集的一个经典使用场景是训练LightPlanner模型，这是一个能够动态生成参数并执行分层深度推理的任务规划器。LightPlanner通过参数化函数调用来控制机器人动作，从而实现细粒度的技能控制，并在复杂场景中提高了任务规划的成功率。

实际应用

LightPlan-40k数据集的实际应用场景包括但不限于机器人任务规划和家庭自动化。通过训练轻量级LLM，该数据集使得机器人能够在资源受限的环境中执行复杂任务，如物品分拣、垃圾回收等。此外，LightPlan-40k数据集还可以用于家庭自动化系统，如智能家居控制、家电操作等。在实际应用中，LightPlanner模型展现出在动态语义推理任务中的高成功率，例如识别“最大的”块并将其放入盒中。这使得轻量级LLM能够在实际环境中实现高效率和高准确率的任务规划，为机器人任务规划和家庭自动化提供了有价值的工具。

衍生相关工作

LightPlan-40k数据集衍生了多个相关的工作，包括动态参数化技能控制和分层深度推理机制的研究。此外，LightPlanner模型的成功也为轻量级LLM在复杂任务规划中的应用提供了新的思路。未来的研究方向包括探索强化学习训练方法，以进一步提高轻量级LLM的推理能力和适应性。此外，多智能体任务规划也是未来的一个研究方向，以实现更复杂的协作机器人应用。LightPlan-40k数据集和相关工作为轻量级LLM在复杂任务规划中的应用奠定了基础，并推动了相关领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集