BrowserAgent-SeedData

Name: BrowserAgent-SeedData
Creator: TIGER-Lab
Published: 2025-10-31 10:46:27
License: 暂无描述

Hugging Face2025-10-31 更新2025-11-01 收录

下载链接：

https://huggingface.co/datasets/TIGER-Lab/BrowserAgent-SeedData

下载链接

链接失效反馈

官方服务：

资源简介：

BrowserAgent-SeedData数据集是一个用于问答任务的数据集，包含多个子集，每个子集都有不同的数据量和训练、验证、测试三种分割方式。数据集的特征包括数据源、提示、能力、奖励模型和额外信息等字段。该数据集以Parquet格式存储。

提供机构：

TIGER-Lab

创建时间：

2025-10-31

原始信息汇总

BrowserAgent-SeedData 数据集概述

基本信息

许可证: Apache-2.0
任务类别: 问答
语言: 英语
数据集名称: BrowserAgent-SeedData
数据规模: 10万<n<100万
总样本数: 230,015
总大小: 29.47 MB

数据集配置

2wiki配置

数据文件:
- 训练集: 2wiki/train-*
- 验证集: 2wiki/validation-*
样本数量: 22,576
数据大小: 2.73 MB
特征字段:
- data_source
- prompt
- ability
- reward_model
- extra_info

bamboogle配置

数据文件:
- 测试集: bamboogle/test-*
样本数量: 125
数据大小: 0.03 MB
特征字段:
- data_source
- prompt
- ability
- reward_model
- extra_info

hotpot配置

数据文件:
- 训练集: hotpot/train-*
- 验证集: hotpot/validation-*
样本数量: 97,852
数据大小: 14.20 MB
特征字段:
- data_source
- prompt
- ability
- reward_model
- extra_info

musique配置

数据文件:
- 训练集: musique/train-*
- 验证集: musique/validation-*
样本数量: 12,417
数据大小: 0.92 MB
特征字段:
- data_source
- prompt
- ability
- reward_model
- extra_info

nq配置

数据文件:
- 训练集: nq/train-*
- 测试集: nq/test-*
样本数量: 82,778
数据大小: 10.14 MB
特征字段:
- data_source
- prompt
- ability
- reward_model
- extra_info

popqa配置

数据文件:
- 测试集: popqa/test-*
样本数量: 14,267
数据大小: 1.45 MB
特征字段:
- data_source
- prompt
- ability
- reward_model
- extra_info

数据存储格式

文件格式: Parquet
存储结构: 按子集目录分别存储
数据划分: 开发集/训练集/测试集

搜集汇总

数据集介绍

构建方式

在智能问答系统蓬勃发展的背景下，BrowserAgent-SeedData数据集通过整合六个权威子集构建而成，涵盖2Wiki、Bamboogle、HotpotQA、Musique、Natural Questions和PopQA等多样化来源。每个子集均采用结构化数据采集策略，从真实网络环境中提取问答对，并严格划分训练集、验证集和测试集。数据以Parquet格式存储，通过多轮对话提示和奖励模型标注，确保了数据构建过程的系统性与可复现性。

特点

该数据集展现出显著的多元异构特性，总量达23万条样本，涵盖开放域问答、多跳推理等多种任务类型。其核心特征在于统一的特征架构设计，每个样本均包含对话提示序列、能力标签和结构化元信息。不同子集间既保持数据格式的一致性，又通过独特的风格标注和真实网页链接保留了原始数据源的领域特异性，为复杂推理任务提供了丰富的语义层次。

使用方法

针对浏览器智能代理的研究需求，该数据集支持灵活的配置加载方式。研究者可通过指定子集名称直接调用特定领域数据，如配置'hotpot'加载多跳推理样本。数据集采用标准化的特征字段设计，prompt字段包含角色化对话内容，reward_model提供评估基准，extra_info则承载原始问答元数据。这种设计使得该数据集既能用于端到端模型训练，也可作为验证基准评估智能体在真实网络环境中的交互能力。

背景与挑战

背景概述

在智能体交互研究领域，BrowserAgent-SeedData数据集作为浏览器操作任务的重要基准，由TIGER-AI实验室于2023年构建完成。该数据集聚焦于开放域问答与网页导航的交叉研究，通过整合2Wiki、HotpotQA等六个权威子集，构建了涵盖多跳推理、事实核查等复杂认知任务的交互轨迹。其核心目标在于解决智能体在动态网络环境中进行目标导向信息检索的泛化能力问题，为构建具备人类水平网页操作能力的自主智能体提供了关键训练资源。

当前挑战

该数据集面临的领域挑战主要体现为多模态环境下的序列决策复杂性，智能体需在非结构化的网页元素中实现精准的信息定位与逻辑推理。构建过程中存在数据异构性整合难题，包括不同子集间标注规范的统一、动态网页内容的时序依赖性建模，以及对抗性测试案例的生成。同时，浏览器操作轨迹的精确复现要求对渲染状态、交互动作等细粒度元数据进行标准化记录，这对数据采集管道的鲁棒性提出了极高要求。

常用场景

经典使用场景

在智能代理研究领域，BrowserAgent-SeedData作为浏览器交互任务的标准测试平台，其经典应用体现在多跳问答系统的训练与评估。该数据集通过整合2Wiki、HotpotQA等知名问答资源，构建了涵盖复杂推理路径的浏览器导航任务。研究者利用其结构化提示与真实网页交互记录，能够系统性地训练智能代理在开放域环境中进行多步骤信息检索与答案整合，为评估代理的网页浏览能力和复杂问题解决性能提供了标准化基准。

实际应用

在实际应用层面，BrowserAgent-SeedData为开发智能助手和自动化信息检索系统提供了重要支撑。基于该数据集训练的浏览器代理能够协助用户完成复杂的信息搜集任务，如学术研究中的文献调研、商业决策中的竞品分析等场景。其多源数据集成的特性使得训练出的代理能够适应不同网站结构和信息呈现方式，在电子商务、在线教育、智能客服等领域展现出广阔的应用前景，显著提升了网络信息获取的效率和准确性。

衍生相关工作

围绕BrowserAgent-SeedData衍生的经典研究主要集中在浏览器导航代理的架构设计与训练方法创新。TIGER-AI-Lab基于该数据集开发了具有网页理解能力的智能代理框架，推动了工具增强型语言模型的发展。后续研究则聚焦于多模态网页元素的理解、长序列交互决策的优化，以及跨网站任务泛化能力的提升。这些工作共同构成了浏览器智能代理研究的技术脉络，为构建下一代网络交互系统提供了理论支撑和实践经验。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集