ShowUI-desktop-8K|UI定位数据集|数据增强数据集
收藏huggingface2024-11-27 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/showlab/ShowUI-desktop-8K
下载链接
链接失效反馈资源简介:
ShowUI-desktop-8K是一个专注于PC端UI定位的数据集,包含从OmniAct数据集获取的截图和注释。通过GPT-4o模型对原始注释进行了增强,添加了外观、空间关系和预期功能等多种属性。数据集包含训练集,共有7496个样本,总大小为16591347652.088字节。
创建时间:
2024-11-27
原始信息汇总
ShowUI-desktop-8K 数据集概述
数据集信息
特征
- image_url: 字符串类型
- image: 图像类型
- instruction: 字符串类型
- bbox: 浮点数序列类型
- point: 浮点数序列类型
- type: 字符串类型
分割
- train: 包含7496个样本,数据大小为16591347652.088字节
数据大小
- 下载大小: 327573839字节
- 数据集大小: 16591347652.088字节
配置
- default: 数据文件路径为
data/train-*
数据集来源
- 基于PC的UI定位数据集,截图和注释最初来源于OmniAct。
- 使用GPT-4o增强原始注释,丰富了外观、空间关系和预期功能等多样属性。
引用
@misc{lin2024showui, title={ShowUI: One Vision-Language-Action Model for GUI Visual Agent}, author={Kevin Qinghong Lin and Linjie Li and Difei Gao and Zhengyuan Yang and Shiwei Wu and Zechen Bai and Weixian Lei and Lijuan Wang and Mike Zheng Shou}, year={2024}, eprint={2411.17465}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.17465}, }
