five

ShowUI-desktop-8K|UI定位数据集|数据增强数据集

收藏
huggingface2024-11-27 更新2024-12-12 收录
UI定位
数据增强
下载链接:
https://huggingface.co/datasets/showlab/ShowUI-desktop-8K
下载链接
链接失效反馈
资源简介:
ShowUI-desktop-8K是一个专注于PC端UI定位的数据集,包含从OmniAct数据集获取的截图和注释。通过GPT-4o模型对原始注释进行了增强,添加了外观、空间关系和预期功能等多种属性。数据集包含训练集,共有7496个样本,总大小为16591347652.088字节。
创建时间:
2024-11-27
原始信息汇总

ShowUI-desktop-8K 数据集概述

数据集信息

特征

  • image_url: 字符串类型
  • image: 图像类型
  • instruction: 字符串类型
  • bbox: 浮点数序列类型
  • point: 浮点数序列类型
  • type: 字符串类型

分割

  • train: 包含7496个样本,数据大小为16591347652.088字节

数据大小

  • 下载大小: 327573839字节
  • 数据集大小: 16591347652.088字节

配置

  • default: 数据文件路径为data/train-*

数据集来源

  • 基于PC的UI定位数据集,截图和注释最初来源于OmniAct
  • 使用GPT-4o增强原始注释,丰富了外观、空间关系和预期功能等多样属性。

引用

@misc{lin2024showui, title={ShowUI: One Vision-Language-Action Model for GUI Visual Agent}, author={Kevin Qinghong Lin and Linjie Li and Difei Gao and Zhengyuan Yang and Shiwei Wu and Zechen Bai and Weixian Lei and Lijuan Wang and Mike Zheng Shou}, year={2024}, eprint={2411.17465}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.17465}, }

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集