HongxinLi/AutoGUI-v1-zip

Name: HongxinLi/AutoGUI-v1-zip
Creator: HongxinLi
Published: 2024-06-19 15:34:55
License: 暂无描述

Hugging Face2024-06-19 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/HongxinLi/AutoGUI-v1-zip

下载链接

链接失效反馈

官方服务：

资源简介：

该存储库包含用于训练AutoGUI模型的训练数据集。Autogui-625k是通过AutoGUI注释管道收集的完整数据集；Cauldron是从整个Cauldron数据集中选择的用于维持训练视觉语言模型（VLM）一般视觉理解能力的两个通用数据集之一；llava_150k是来自LLaVA的150k指令跟随数据集。使用这些数据集时，需要下载后修改JSON文件中的图像路径为绝对路径，并合并三个JSON文件以用于AutoGUI训练脚本。

提供机构：

HongxinLi

原始信息汇总

数据集概述

数据集列表

Autogui-625k
- 描述：由AutoGUI标注流水线收集的完整数据集。
Cauldron
- 描述：用于维持训练的视觉语言模型（VLM）的通用视觉理解能力的通用数据集之一。
- 包含子集：Screen2Words, DocVQA, OCR-VQA, visualmrc, infovga, Diagram image-to-text。
llava_150k
- 描述：来自LLaVA的150k指令跟随数据集。

数据处理

下载所有三个数据集后，需将JSON文件中的每个样本的图像路径修改为Qwen-VL微调框架所需的绝对路径。
合并三个JSON文件，生成用于AutoGUI训练脚本的data_path参数。

5,000+

优质数据集

54 个

任务类型

进入经典数据集