GUI-Rise-pseudo-label
收藏数据集概述:GUI-Rise Pseudo-Labeled GUI Navigation Trajectories
数据集描述
本数据集包含用于训练和评估GUI-Rise智能体的伪标记GUI导航轨迹。该智能体在论文《GUI-Rise: Structured Reasoning and History Summarization for GUI Navigation》中被提出。
- 项目主页: https://leon022.github.io/GUI-Rise/
- 代码仓库: https://github.com/Leon022/GUI-Rise-code
- 论文地址: https://arxiv.org/pdf/2510.27210
动机与目的
GUI-Rise采用结构化的三阶段推理框架(“思考-行动-总结”)来增强GUI导航任务中的决策能力。为便于训练该智能体,本数据集提供了高质量的、机器生成的伪标签,这些标签将每个导航步骤分解为GUI-Rise范式所需的核心推理组件。
数据结构与内容
数据集由一个或多个JSON Lines(.jsonl)文件组成。每一行是一个代表单个动作的JSON对象。
数据字段
| 字段名 | 数据类型 | 描述 |
|---|---|---|
annotation_id |
string |
任务或标注会话的唯一标识符。 |
step_id |
int |
轨迹内步骤的顺序标识符(从0开始)。 |
pseudo_labels |
dict |
包含三阶段推理输出的核心伪标签。 |
伪标签对象 (pseudo_labels)
该字典包含对应step_id的GUI-Rise推理框架的三个关键组件:
progress_estimation(string): 界面理解与进度估计。分析当前GUI状态,识别相关元素和信息,并评估在完成整体任务目标方面取得的进展。decision_reasoning(string): 策略制定。详细说明选择下一个动作的推理过程。评估潜在动作,考虑约束条件,并为紧接的下一步制定计划。history_summary(string): 更新的历史摘要。提供截至当前步骤(包括当前步骤执行的动作)的交互历史的简明摘要。它综合了过去的动作和观察以保持上下文。
引用信息
如果使用本数据集,请引用相关的GUI-Rise论文: bibtex @article{liu2025gui, title={GUI-Rise: Structured Reasoning and History Summarization for GUI Navigation}, author={Liu, Tao and Wang, Chongyu and Li, Rongjie and Yu, Yingchen and He, Xuming and Song, Bai}, journal={arXiv preprint arXiv:2510.27210}, year={2025} }
加载数据集
可以使用Hugging Face的datasets库轻松加载此数据集:
python
from datasets import load_dataset
dataset = load_dataset("Leon022/GUI-Rise-pseudo-label")




