LucasThil/miniwob_snippets_refs_onehot
收藏Hugging Face2023-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LucasThil/miniwob_snippets_refs_onehot
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: episodes
dtype: string
- name: refs
dtype: int64
- name: click
dtype: int64
- name: dblclick
dtype: int64
- name: keydown
dtype: int64
- name: keypress
dtype: int64
- name: keyup
dtype: int64
- name: mousedown
dtype: int64
- name: mouseup
dtype: int64
- name: scroll
dtype: int64
- name: '1'
dtype: int64
- name: '2'
dtype: int64
- name: '3'
dtype: int64
- name: '4'
dtype: int64
- name: '5'
dtype: int64
- name: '6'
dtype: int64
- name: '7'
dtype: int64
- name: '8'
dtype: int64
- name: '9'
dtype: int64
- name: '10'
dtype: int64
- name: '11'
dtype: int64
- name: '12'
dtype: int64
- name: '13'
dtype: int64
- name: '14'
dtype: int64
- name: '15'
dtype: int64
- name: '16'
dtype: int64
- name: '17'
dtype: int64
- name: '18'
dtype: int64
- name: '19'
dtype: int64
- name: '20'
dtype: int64
- name: '21'
dtype: int64
- name: '22'
dtype: int64
- name: '23'
dtype: int64
- name: '24'
dtype: int64
- name: '25'
dtype: int64
- name: '26'
dtype: int64
- name: '27'
dtype: int64
- name: '28'
dtype: int64
- name: '29'
dtype: int64
- name: '30'
dtype: int64
- name: '32'
dtype: int64
- name: '33'
dtype: int64
- name: '34'
dtype: int64
- name: '35'
dtype: int64
- name: '36'
dtype: int64
- name: '37'
dtype: int64
- name: '38'
dtype: int64
- name: '39'
dtype: int64
- name: '40'
dtype: int64
- name: '41'
dtype: int64
- name: '42'
dtype: int64
- name: '43'
dtype: int64
- name: '44'
dtype: int64
- name: '45'
dtype: int64
- name: '46'
dtype: int64
- name: '47'
dtype: int64
- name: '48'
dtype: int64
- name: '49'
dtype: int64
- name: '50'
dtype: int64
- name: '51'
dtype: int64
- name: '52'
dtype: int64
- name: '53'
dtype: int64
- name: '54'
dtype: int64
- name: '55'
dtype: int64
- name: '56'
dtype: int64
- name: '57'
dtype: int64
- name: '58'
dtype: int64
- name: '59'
dtype: int64
- name: '60'
dtype: int64
- name: '61'
dtype: int64
- name: '62'
dtype: int64
- name: '63'
dtype: int64
- name: '64'
dtype: int64
- name: '65'
dtype: int64
- name: '66'
dtype: int64
- name: '67'
dtype: int64
- name: '68'
dtype: int64
- name: '69'
dtype: int64
- name: '70'
dtype: int64
- name: '71'
dtype: int64
- name: '72'
dtype: int64
- name: '73'
dtype: int64
- name: '74'
dtype: int64
- name: '75'
dtype: int64
- name: '76'
dtype: int64
- name: '77'
dtype: int64
- name: '78'
dtype: int64
- name: '79'
dtype: int64
- name: '80'
dtype: int64
- name: '81'
dtype: int64
- name: '82'
dtype: int64
- name: '83'
dtype: int64
- name: '84'
dtype: int64
- name: '85'
dtype: int64
- name: '86'
dtype: int64
- name: '87'
dtype: int64
- name: '88'
dtype: int64
- name: '89'
dtype: int64
- name: '90'
dtype: int64
- name: '91'
dtype: int64
- name: '92'
dtype: int64
- name: '93'
dtype: int64
- name: '94'
dtype: int64
- name: '95'
dtype: int64
- name: '96'
dtype: int64
- name: '97'
dtype: int64
- name: '98'
dtype: int64
- name: '99'
dtype: int64
- name: '100'
dtype: int64
- name: '101'
dtype: int64
- name: '102'
dtype: int64
- name: '103'
dtype: int64
- name: '104'
dtype: int64
- name: '105'
dtype: int64
- name: '106'
dtype: int64
- name: '107'
dtype: int64
- name: '108'
dtype: int64
- name: '109'
dtype: int64
- name: '110'
dtype: int64
- name: '111'
dtype: int64
- name: '112'
dtype: int64
- name: '113'
dtype: int64
- name: '114'
dtype: int64
- name: '115'
dtype: int64
- name: '116'
dtype: int64
- name: '117'
dtype: int64
- name: '118'
dtype: int64
- name: '119'
dtype: int64
- name: '120'
dtype: int64
- name: '121'
dtype: int64
- name: '122'
dtype: int64
- name: '123'
dtype: int64
- name: '124'
dtype: int64
- name: '125'
dtype: int64
- name: '126'
dtype: int64
- name: '127'
dtype: int64
- name: '129'
dtype: int64
- name: '130'
dtype: int64
- name: '131'
dtype: int64
- name: '132'
dtype: int64
- name: '133'
dtype: int64
- name: '134'
dtype: int64
- name: '135'
dtype: int64
- name: '136'
dtype: int64
- name: '137'
dtype: int64
- name: '138'
dtype: int64
- name: '139'
dtype: int64
- name: '140'
dtype: int64
- name: '142'
dtype: int64
- name: '143'
dtype: int64
- name: '144'
dtype: int64
- name: '145'
dtype: int64
- name: '146'
dtype: int64
- name: '147'
dtype: int64
- name: '148'
dtype: int64
- name: '149'
dtype: int64
- name: '150'
dtype: int64
- name: '151'
dtype: int64
- name: '152'
dtype: int64
- name: '153'
dtype: int64
- name: '154'
dtype: int64
- name: '155'
dtype: int64
- name: '156'
dtype: int64
- name: '157'
dtype: int64
- name: '160'
dtype: int64
- name: '166'
dtype: int64
- name: '180'
dtype: int64
- name: '181'
dtype: int64
splits:
- name: train
num_bytes: 1188943765
num_examples: 464060
- name: test
num_bytes: 148857112
num_examples: 58068
- name: validate
num_bytes: 148842043
num_examples: 57976
download_size: 150978553
dataset_size: 1486642920
---
# Dataset Card for "miniwob_snippets_refs_onehot"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
LucasThil
原始信息汇总
数据集概述
数据集名称
"miniwob_snippets_refs_onehot"
数据集特征
数据集包含多个特征,主要分为以下几类:
- 字符串类型:
episodes
- 整数类型:
refsclick至mouseup(共10个特征)scroll至181(共152个特征,其中缺失128,128至139,141,142,158至159,161至165,167至179,182至255)
数据集划分
- 训练集:
- 样本数量:464,060
- 数据大小:1,188,943,765字节
- 测试集:
- 样本数量:58,068
- 数据大小:148,857,112字节
- 验证集:
- 样本数量:57,976
- 数据大小:148,842,043字节
数据集大小
- 下载大小:150,978,553字节
- 数据集总大小:1,486,642,920字节
搜集汇总
数据集介绍

构建方式
在强化学习与交互式任务自动化领域,MiniWoB数据集为智能体学习网页交互提供了基准环境。本数据集基于MiniWoB环境构建,通过记录智能体与网页元素交互的轨迹片段,将原始交互序列转化为结构化数据。具体而言,数据采集过程涉及智能体执行点击、滚动、按键等多样化操作,每个操作被编码为离散事件,并关联到网页中的特定元素引用。这些交互片段经过系统化整理,形成包含大量轨迹样本的数据集,为后续模型训练奠定基础。
特点
该数据集的核心特征在于其丰富的交互事件表示与细粒度的元素引用编码。数据集中每个样本均包含智能体在网页环境中的完整交互序列,涵盖鼠标点击、键盘输入、滚动等多种事件类型,并以独热编码形式呈现,确保了事件表示的明确性与可计算性。此外,数据集通过数值化引用标识网页元素,使得模型能够精准关联交互动作与界面对象。这种结构设计不仅提升了数据的机器可读性,也为复杂交互行为的建模提供了多维特征支持。
使用方法
在应用层面,该数据集主要用于训练和评估基于强化学习或模仿学习的网页交互智能体。研究人员可通过加载数据集中的训练、验证与测试划分,提取交互序列与对应的事件编码,构建端到端的任务学习模型。典型的使用流程包括解析episodes字段中的轨迹数据,结合refs与各类事件特征,训练智能体预测或生成交互策略。数据集的标准划分确保了模型评估的可靠性,使其能够广泛应用于自动化任务执行、人机交互仿真等研究场景。
背景与挑战
背景概述
在强化学习与自然语言处理交叉领域,交互式任务学习是核心研究议题。LucasThil/miniwob_snippets_refs_onehot数据集基于MiniWoB(Mini World of Bits)基准构建,该基准由斯坦福大学研究人员于2017年提出,旨在通过模拟网页环境训练智能体执行自然语言指令。此数据集聚焦于将网页交互事件(如点击、滚动、按键)编码为独热向量,以解决指令理解与动作执行的映射问题,对推动具身智能与自动化流程技术发展具有显著影响力。
当前挑战
该数据集致力于解决网页交互任务中指令到动作的精确映射挑战,其复杂性体现在高维离散动作空间的表示与泛化。构建过程中,需将原始交互轨迹转化为结构化特征,面临事件序列的稀疏性、噪声过滤以及独热编码维度爆炸等难题。同时,确保数据在训练、验证与测试分割中的分布一致性,以支持模型在未见任务上的稳健评估,亦是关键挑战。
常用场景
经典使用场景
在强化学习与指令跟随智能体研究领域,miniwob_snippets_refs_onehot数据集常被用于训练和评估模型在网页交互环境中的任务执行能力。该数据集源自MiniWoB基准测试,通过记录用户在网页界面上的操作序列,如点击、滚动和按键事件,构建了丰富的交互轨迹。研究者利用这些轨迹训练智能体理解自然语言指令,并精准执行网页操作,从而探索智能体在复杂环境中的决策与泛化能力。
衍生相关工作
围绕该数据集,学术界衍生了一系列经典研究工作,主要集中在强化学习与自然语言处理交叉领域。例如,基于深度Q网络(DQN)和策略梯度的方法被用于优化智能体在MiniWoB环境中的表现;后续研究引入了注意力机制和元学习策略,以提升模型在未见任务上的泛化能力。这些工作不仅推动了网页交互智能体的技术进步,也为更广泛的序列决策问题提供了方法论借鉴。
数据集最近研究
最新研究方向
在强化学习与交互式任务自动化领域,MiniWoB数据集作为基准测试平台,其衍生版本如miniwob_snippets_refs_onehot正推动着智能体行为建模的前沿探索。该数据集通过编码用户界面交互事件与元素引用,为研究基于深度学习的网络浏览自动化提供了结构化数据支持。当前热点聚焦于利用此类数据训练端到端模型,以提升智能体在复杂网页环境中的泛化能力与决策效率,相关进展对于开发自主数字助手及优化人机协作流程具有深远意义。
以上内容由遇见数据集搜集并总结生成



