MolmoWeb-SyntheticTrajs
收藏Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/allenai/MolmoWeb-SyntheticTrajs
下载链接
链接失效反馈官方服务:
资源简介:
MolmoWeb-SyntheticTrajs 是一个合成的网页导航轨迹数据集,每个样本包含一条指令、一系列网页截图以及对应的代理操作(如点击、输入、滚动等)。数据集旨在支持网页导航任务的研究与教育。数据集包含多个子集,分别基于不同的生成方法或任务来源,包括模板生成的轨迹、基于Webvoyager和OnlineMind2Web任务生成的轨迹、多代理轨迹以及基于前500节点的节点遍历轨迹。每个样本包含唯一的sample_id、JSON编码的任务指令、JSON编码的轨迹(按步骤索引键控,包含代理操作和截图文件名)以及截图列表(包含原始图像数据和用于匹配轨迹步骤的文件名)。轨迹的每个步骤详细记录了截图文件名、代理操作(包括可解析的操作字符串、自然语言描述和结构化输出)、浏览器状态(如当前URL、页面索引等)以及操作时间戳。数据集采用ODC-BY 1.0许可,遵循Ai2的负责任使用指南,适用于研究和教育用途。
提供机构:
Allen Institute for AI
创建时间:
2026-03-21



