benwiesel/ScreenSpot|GUI理解数据集|跨平台应用数据集
收藏ScreenSpot 数据集概述
数据集描述
ScreenSpot 数据集是一个用于GUI接地任务的评估基准,旨在促进跨多种平台(包括iOS、Android、macOS、Windows和Web)的图形用户界面(GUIs)理解模型的开发和测试。该数据集包含超过1,200条指令,与来自不同平台的GUI元素配对。每个条目都经过细致标注,以区分文本和图标/部件元素,为训练和评估GUI理解模型提供了一个全面的资源。
数据集结构
目录结构
- images/: 包含来自不同平台的所有图像(iOS、Android、macOS、Windows、Web)。
- annotations/: 包含不同数据集分割的标注JSON文件(screenspot_desktop.json, screenspot_mobile.json, screenspot_web.json)。
标注格式
每个JSON文件中的标注遵循以下结构: json { "img_filename": "example_filename.png", "annotations": [ { "bbox": [x, y, width, height], "instruction": "Example instruction", "data_type": "icon/text", "data_source": "platform" } ] }
- img_filename: 图像文件的名称。
- bbox: 标注的GUI元素的边界框(格式:[x, y, width, height])。
- instruction: 与GUI元素相关的指令。
- data_type: GUI元素的类型(图标/文本)。
- data_source: GUI元素的来源平台(iOS、Android、macOS、Windows、Web)。
数据集用途
ScreenSpot 数据集适用于训练和评估GUI接地任务的模型。它提供了跨不同平台的多样指令和GUI元素,非常适合开发跨平台的GUI理解模型。

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
LUNA16
LUNA16(肺结节分析)数据集是用于肺分割的数据集。它由 1,186 个肺结节组成,在 888 次 CT 扫描中进行了注释。
OpenDataLab 收录
TongueDx Dataset
TongueDx数据集是一个专为远程舌诊研究设计的综合性舌象图像数据集,由香港理工大学和新加坡管理大学的研究团队创建。该数据集包含5109张图像,涵盖了多种环境条件下的舌象,图像通过智能手机和笔记本电脑摄像头采集,具有较高的多样性和代表性。数据集不仅包含舌象图像,还提供了详细的舌面属性标注,如舌色、舌苔厚度等,并附有受试者的年龄、性别等人口统计信息。数据集的创建过程包括图像采集、舌象分割、标准化处理和多标签标注,旨在解决远程医疗中舌诊图像质量不一致的问题。该数据集的应用领域主要集中在远程医疗和中医诊断,旨在通过自动化技术提高舌诊的准确性和可靠性。
arXiv 收录
中国1km分辨率逐月平均气温数据集(1901-2024)
该数据为中国逐月平均温度数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录