Android Instruct|Android自主代理数据集|移动操作系统数据集
收藏AndroidLab: 训练和系统化基准测试Android自主代理
数据集概述
- 名称: AndroidLab
- 描述: AndroidLab是一个系统化的Android代理框架,包含操作环境和可复现的基准测试。基准测试包括预定义的Android虚拟设备和基于这些设备的138个任务,涵盖九个应用程序。
基准测试组件
- 应用列表:
- Bluecoins: 个人财务管理应用,用于跟踪支出和收入。
- Calendar: 日历应用,帮助组织日程和设置提醒。
- Cantook: 电子书阅读器,用于存储、管理和阅读电子书。
- Clock: 时钟应用,用于显示时间、设置闹钟和使用秒表。
- Contacts: 联系人管理应用,用于存储和组织联系信息。
- Maps.me: 离线地图应用,用于导航和探索地点。
- PiMusic: 音乐播放器应用,用于组织和播放本地存储的音乐文件。
- Settings: 设置应用,用于配置设备设置和偏好。
- Zoom: 视频会议应用,用于主持和加入在线会议。
 
快速开始
- 环境设置:
- 自动评估管道:
- 
运行评估: bash python eval.py -n test_name -c your path to config.yaml 
- 
并行测试: bash python eval.py -n test_name -c your path to config.yaml -p 3 
- 
生成评估结果: bash python generate_result.py --input_folder ./logs/evaluation/ --output_folder ./logs/evaluation/ --output_excel ./logs/evaluation/test_name.xlsx --judge_model gpt-4o-2024-05-13 
 
- 
引用
@misc{xu2024androidlabtrainingsystematicbenchmarking, title={AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents}, author={Yifan Xu and Xiao Liu and Xueqiao Sun and Siyi Cheng and Hao Yu and Hanyu Lai and Shudan Zhang and Dan Zhang and Jie Tang and Yuxiao Dong}, year={2024}, eprint={2410.24024}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2410.24024}, }

- 1AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents清华大学 · 2024年
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
中国近海地形数据集(渤海,黄海,东海,南海)
本数据集包含历年来通过收集和实测方法取得的中国近海水深点数据、地形图数据(ArcGIS格式),以及黄河口、莱州湾东部、辽东湾、山东南部沿海、南海部分海域的单波束、多波束水深测量数据,包括大尺度的低密度水深数据与局部高密度水深数据。
地球大数据科学工程 收录
中国区域250米植被覆盖度数据集(2000-2024)
该数据集是中国区域2000至2024年月度植被覆盖度产品,空间分辨率250米,合成方式采用月最大值合成,每年12期,共299期。本产品采用基于归一化植被指数(NDVI)像元二分模型,根据土地利用类型确定纯植被像元值和纯裸土像元值,实现植被覆盖度计算。本产品去除湖泊、河流、冰川/永久积雪等区域。其中,NDVI数据来源于国家青藏高原科学数据中心中国区域250米归一化植被指数数据集(2000-2024)产品。通过时空变化趋势分析检验法分析,该数据集符合时间变化趋势和空间变化趋势。该数据集能够为全国区域生态质量评价、重要生态空间调查评估等工作提供数据参考。
国家青藏高原科学数据中心 收录
danaroth/icvl
ICVL是一个高光谱图像数据集,由Specim PS Kappa DX4高光谱相机和旋转平台进行空间扫描采集。数据集目前包含200张图像,并且会逐步增加。图像的空间分辨率为1392×1300,覆盖519个光谱波段(400-1000nm,间隔约1.25nm)。数据集提供了ENVI格式的原始数据和MAT格式的下采样数据(31个光谱通道,400-700nm,间隔10nm)。原始数据集仅包含干净的图像,用于高光谱图像去噪的测试数据来自另一篇论文。
hugging_face 收录
M4-SAR
M4-SAR是一个多分辨率、多极化、多场景、多源数据集,用于光学与合成孔径雷达(SAR)融合的目标检测。该数据集由南京理工大学PCA实验室、安徽大学ICSP教育部重点实验室和南开大学计算机科学学院共同构建,包含112,184对精确对齐的图像和近一百万个标注实例。数据集覆盖六个关键类别,并使用公开的光学和SAR数据,包括Sentinel-1和Sentinel-2卫星提供的数据。为了克服SAR标注的挑战,该研究提出了一种半监督的光学辅助标注策略,利用光学图像的语义丰富性来显著提高标注质量。M4-SAR数据集旨在解决现有光学和SAR数据集的局限性,为多源融合目标检测任务提供大规模、高质量、标准化的数据集,并推动相关研究的发展。
arXiv 收录
