TextWorldCookAgent-Medium
收藏Hugging Face2026-03-27 更新2026-03-28 收录
下载链接:
https://huggingface.co/datasets/YukinoshitaYukino/TextWorldCookAgent-Medium
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含400个测试样本,总大小约1.3MB。数据结构包含以下字段:prompt(JSON格式列表)、env_id(字符串)、game_seed(64位整数)、warm_actions(字符串列表)、max_steps(64位整数)、walkthrough(字符串列表)、walkthrough_len(64位整数)以及group_id(字符串)。数据集仅包含测试集划分,未提供具体的任务背景或使用场景说明。
创建时间:
2026-03-26
搜集汇总
数据集介绍

构建方式
在交互式文本游戏与智能体研究领域,TextWorldCookAgent-Medium数据集通过精心设计的烹饪任务环境构建而成。其核心机制在于利用TextWorld框架生成多样化的游戏实例,每个实例均包含独特的初始状态、目标食谱及可交互的厨房环境。数据生成过程系统性地采集了智能体与环境交互的完整轨迹,包括每一步的动作序列、状态变化以及预设的标准通关路径,从而形成结构化的轨迹记录。
特点
该数据集以其高度结构化的轨迹数据为显著特征,每条记录均完整封装了游戏种子、环境标识、动作序列与标准攻略等关键元素。其设计注重任务多样性与复杂性平衡,涵盖中等难度的烹饪子任务,旨在评估智能体在遵循指令、执行多步操作及处理对象交互方面的能力。数据格式统一且富含语义信息,为分析智能体的规划、学习与泛化性能提供了扎实基础。
使用方法
研究人员可将该数据集直接应用于智能体评估与算法开发,尤其适合作为文本游戏环境中顺序决策与任务完成度的基准测试工具。典型使用流程包括加载数据集后,依据环境标识与游戏种子初始化任务实例,随后让智能体依据观察状态生成动作,并通过对比其执行轨迹与标准攻略来量化性能。数据集支持对智能体的动作效率、路径合规性及泛化至未见任务的能力进行系统分析。
背景与挑战
背景概述
在人工智能与自然语言处理领域,交互式文本环境已成为评估智能体推理与规划能力的关键平台。TextWorldCookAgent-Medium数据集由相关研究机构于近年推出,旨在为烹饪任务导向的文本游戏提供结构化基准。该数据集聚焦于智能体在复杂、多步骤的烹饪指令环境中的执行与适应问题,通过模拟真实世界的烹饪流程,推动具身智能与任务导向对话系统的研究进展,对提升智能体的常识推理与序列决策能力具有显著影响。
当前挑战
该数据集核心挑战在于解决烹饪领域文本交互中的多步骤规划与动态环境适应问题,要求智能体在模糊或开放的指令下进行准确的物品操作与状态跟踪。构建过程中,挑战体现在如何设计多样且真实的烹饪场景以确保泛化性,同时平衡游戏难度与可解性,并生成高质量、连贯的交互轨迹以支持可靠的评估。
常用场景
经典使用场景
在交互式文本游戏领域,TextWorldCookAgent-Medium数据集为智能体学习复杂烹饪任务提供了标准化的评估平台。该数据集通过模拟厨房环境中的多步骤操作序列,如获取食材、使用厨具和遵循食谱,使研究者能够训练和测试智能体在自然语言指令下的规划与执行能力。其结构化游戏场景和详细的动作轨迹记录,为评估智能体在动态环境中的推理和适应性设立了基准,推动了文本交互智能体的发展。
解决学术问题
该数据集主要解决了人工智能中智能体在开放域文本环境下的序列决策和常识推理问题。通过提供丰富的烹饪任务,它帮助研究者探索智能体如何理解自然语言指令、管理长期目标,并在不确定环境中做出合理选择。这促进了强化学习、自然语言处理与知识推理的交叉研究,为构建更通用、鲁棒的交互式智能体提供了数据支撑,填补了文本游戏领域缺乏标准化复杂任务评估的空白。
衍生相关工作
围绕该数据集,衍生了一系列经典研究工作,主要集中在文本游戏智能体的算法创新上。例如,研究者利用强化学习与语言模型结合的方法,如基于Transformer的规划网络,来提升智能体在烹饪任务中的表现。这些工作不仅优化了智能体的决策策略,还推动了可解释AI和常识推理模型的发展,为后续更复杂的交互环境数据集构建和评估框架设计提供了重要参考。
以上内容由遇见数据集搜集并总结生成



