MolmoWeb-HumanTrajs
收藏Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/allenai/MolmoWeb-HumanTrajs
下载链接
链接失效反馈官方服务:
资源简介:
MolmoWeb-SyntheticSkills 是一个包含人类收集的网页轨迹的数据集。每个样本将一个指令与一系列网页截图及相应的代理操作(如点击、输入、滚动等)配对。数据集包含以下字段:sample_id(唯一标识轨迹的哈希值)、instruction(JSON编码的任务指令,包含low_level等键)、trajectory(JSON编码的轨迹,按步骤索引键控,每个条目包含代理的解析操作和截图文件名)、images(截图结构列表,bytes为原始图像数据,path为用于匹配轨迹步骤的文件名)、image_paths(用于匹配轨迹步骤的截图路径列表)。数据集分为train(35,971个样本)和preview(10个样本)两个部分。每个轨迹步骤包含截图文件名、代理操作(可解析的操作字符串、自然语言描述和结构化输出)、浏览器状态(当前URL、页面索引、打开的页面标题和URL)以及操作时间戳。该数据集采用ODC-BY 1.0许可证,旨在用于研究和教育用途。
提供机构:
Allen Institute for AI
创建时间:
2026-03-21



