five

MolmoWeb-SyntheticGround

收藏
Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/allenai/MolmoWeb-SyntheticGround
下载链接
链接失效反馈
官方服务:
资源简介:
MolmoWeb-SyntheticGround 是一个包含网页截图与合成基础任务配对的数据集。每个示例要求模型识别页面上的目标元素,并提供真实边界框和(对于GPT示例)自然语言思考。数据集包含两种配置:'template'(使用模板生成的基础问题,不涉及GPT)和 'gpt'(由GPT5选择的元素,包含GPT5生成的查询和思考)。主要特征包括:'image'(网页截图)、'messages'(与此截图相关的基础任务列表)、'metadata'(包含网站名称、页面URL、图像宽度和高度等信息的结构体)。每个'messages'条目包含'question'(目标元素的基础查询)、'answer'(JSON编码的答案对象)、'thought'(GPT或模板生成的推理)和'bbox'(目标元素的JSON编码边界框)。数据集规模:'gpt'配置包含130,370个示例,'template'配置包含232,089个示例。该数据集采用ODC-BY 1.0许可证,旨在研究和教育用途。
提供机构:
Allen Institute for AI
创建时间:
2026-03-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作