five

GUI Odyssey

收藏
github2024-06-24 更新2024-06-25 收录
下载链接:
https://github.com/OpenGVLab/GUI-Odyssey
下载链接
链接失效反馈
官方服务:
资源简介:
GUI Odyssey是一个综合数据集,用于训练和评估移动设备上的跨应用GUI导航代理。该数据集包含7,735个来自6种移动设备的剧集,涵盖6种类型的跨应用任务、201个应用和1.4K应用组合。

GUI Odyssey is a comprehensive dataset designed for training and evaluating cross-app GUI navigation agents on mobile devices. This dataset contains 7,735 episodes from 6 types of mobile devices, covering 6 types of cross-app tasks, 201 applications, and 1.4K app combinations.
创建时间:
2024-06-06
原始信息汇总

GUI Odyssey 数据集概述

简介

GUI Odyssey 是一个全面的跨应用导航代理训练和评估数据集。该数据集包含来自6种移动设备的7,735个片段,涵盖6种类型的跨应用任务、201个应用和1.4K个应用组合。

数据收集流程

GUI Odyssey 包含六种类型的导航任务。对于每种类型,我们构建了包含预定义池中选择的项目和应用的指令模板,生成大量独特的指令以标注GUI片段。通过在Android模拟器上的人类演示捕获每个片段的元数据,并经过严格的质量检查,最终包含7,735个经过验证的跨应用GUI导航片段。

统计数据

分割类型 片段数量 唯一提示数量 平均步骤数 数据位置 模型
总计 7,735 7,735 15.4 GUI-Odyssey OdysseyAgent
随机训练与测试 5,802 / 1,933 5,802 / 1,933 15.4 / 15.2 random_split.json OdysseyAgent-Random
任务训练与测试 6,719 / 1,016 6,719 / 1,016 15.0 / 17.6 task_split.json OdysseyAgent-Task
设备训练与测试 6,473 / 1,262 6,473 / 1,262 15.4 / 15.0 device_split.json OdysseyAgent-Device
应用训练与测试 6,596 / 1,139 6,596 / 1,139 15.4 / 15.3 app_split.json OdysseyAgent-App

数据集访问

GUI Odyssey 数据集托管在 Huggingface。可以通过以下命令克隆整个数据集: shell git clone https://huggingface.co/datasets/OpenGVLab/GUI-Odyssey

克隆后,将数据集移动到 ./data 目录中,结构如下:

GUI-Odyssey ├── data │ ├── annotations │ │ └── *.json │ ├── screenshots │ │ └── *.png │ ├── splits │ │ ├── app_split.json │ │ ├── device_split.json │ │ ├── random_split.json │ │ └── task_split.json │ ├── format_converter.py │ └── preprocessing.py └── ...

然后运行预处理脚本: shell cd data python preprocessing.py

最终结构如下:

GUI-Odyssey ├── data │ ├── annotations │ │ └── *.json │ ├── screenshots │ │ └── *.png │ ├── splits │ │ ├── app_split.json │ │ ├── device_split.json │ │ ├── random_split.json │ │ └── task_split.json │ ├── format_converter.py │ └── preprocessing.py └── ...

引用

如果您觉得 GUI Odyssey 对您的项目或研究有用,请使用以下 BibTeX 条目引用我们的论文: bib @misc{lu2024gui, title={GUI Odyssey: A Comprehensive Dataset for Cross-App GUI Navigation on Mobile Devices}, author={Quanfeng Lu and Wenqi Shao and Zitao Liu and Fanqing Meng and Boxuan Li and Botong Chen and Siyuan Huang and Kaipeng Zhang and Yu Qiao and Ping Luo}, year={2024}, eprint={2406.08451}, archivePrefix={arXiv}, primaryClass={cs.CV} }

搜集汇总
数据集介绍
main_image_url
构建方式
在构建GUI Odyssey数据集时,研究团队精心设计了六个类别的导航任务。每个类别中,通过从预定义的池中选择项目和应用程序,生成大量的指令模板,从而创建出独特的指令集。这些指令用于标注GUI导航的各个片段。通过在Android模拟器上进行的人工演示,捕获每个片段的元数据,并以全面格式记录。经过严格的质量检查后,最终形成了包含7,735个经过验证的跨应用程序GUI导航片段的GUI Odyssey数据集。
使用方法
使用GUI Odyssey数据集时,用户首先需要从Huggingface平台克隆整个数据集,并将其存储在本地目录中。随后,通过运行预处理脚本,组织和整理截图文件夹,确保数据结构的完整性。数据集提供了多种分割文件,用户可以根据需求选择合适的分割方式进行实验或模型训练。此外,数据集还附带了格式转换和数据预处理的代码,便于用户进行进一步的数据处理和分析。
背景与挑战
背景概述
GUI Odyssey数据集是由Quanfeng Lu、Wenqi Shao等研究人员于2024年创建,旨在为移动设备上的跨应用图形用户界面(GUI)导航提供一个综合性的训练和评估平台。该数据集包含了7,735个从6种不同移动设备上采集的跨应用导航任务,涵盖了201个应用和1.4K种应用组合。主要研究问题集中在如何通过大规模数据集训练和评估跨应用导航代理,以提升移动设备上的用户体验和操作效率。该数据集的发布对移动应用交互研究领域具有重要影响,为相关研究提供了丰富的资源和基准。
当前挑战
GUI Odyssey数据集在构建过程中面临多项挑战。首先,跨应用导航任务的多样性和复杂性要求数据集必须涵盖广泛的应用和任务类型,这增加了数据采集和标注的难度。其次,确保数据质量的严格性,包括对每集数据的元数据进行全面捕获和验证,以保证数据集的可靠性和实用性。此外,数据集的规模和多样性也带来了存储和处理上的挑战,需要高效的存储解决方案和数据预处理技术。这些挑战共同构成了GUI Odyssey数据集在实际应用中的重要课题。
常用场景
经典使用场景
在移动设备用户界面(GUI)导航领域,GUI Odyssey数据集的经典使用场景主要集中在跨应用程序导航任务的训练与评估。该数据集通过模拟真实世界中的跨应用操作,如从社交媒体应用切换到购物应用,为导航代理提供了丰富的训练样本。研究者可以利用这些数据训练模型,使其能够在不同应用之间进行高效且准确的导航,从而提升用户体验。
解决学术问题
GUI Odyssey数据集解决了移动设备上跨应用导航任务中的关键学术问题。传统方法在处理跨应用导航时往往面临数据稀疏和泛化能力不足的挑战。通过提供大规模、多样化的跨应用导航数据,GUI Odyssey显著增强了模型的泛化能力和鲁棒性。这不仅推动了相关领域的研究进展,还为开发更智能的移动设备导航系统奠定了基础。
实际应用
在实际应用中,GUI Odyssey数据集为开发智能移动设备导航系统提供了宝贵的资源。例如,智能手机用户在进行多任务操作时,系统可以根据用户需求自动切换应用,提升操作效率。此外,该数据集还可用于智能家居设备、车载系统等需要复杂界面导航的场景,帮助实现更智能、更便捷的用户体验。
数据集最近研究
最新研究方向
在移动设备用户界面(GUI)导航领域,GUI Odyssey数据集的最新研究方向主要集中在跨应用导航代理的训练与评估。该数据集通过包含7,735个跨应用导航任务的实例,涵盖了6种不同类型的任务、201个应用以及1,400多种应用组合,为研究者提供了一个全面且多样化的实验平台。前沿研究不仅关注于提升导航代理的准确性和效率,还探索了如何通过数据增强和模型优化来应对跨应用导航中的复杂性和多样性。这些研究对于推动移动设备用户体验的智能化和自动化具有重要意义,尤其是在多任务处理和应用间无缝切换的场景中。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作