five

OS-Omni-VM

收藏
Hugging Face2026-05-03 更新2026-05-04 收录
下载链接:
https://huggingface.co/datasets/Cloudriver/OS-Omni-VM
下载链接
链接失效反馈
官方服务:
资源简介:
OS-Omni VM 数据集是一个用于桌面代理基准测试环境的预构建虚拟机镜像集合。数据集包含两个主要部分:Android AVD(Android 虚拟设备)和 Linux VMware 镜像。Android AVD 导出了 AndroidWorldAvd,并安装了多个基准测试应用程序,如 K-9 Mail、Delta Chat、LibreOffice Viewer 等,同时提供了详细的安装和配置说明。Linux VMware 镜像经过清理、零填充和压缩处理,包含一个用于基准测试重置的干净快照,并配置了运行 OS-Omni Linux 任务所需的应用程序。数据集还提供了每个文件的 SHA256 校验和以及清单文件,以确保数据的完整性和可验证性。

The OS-Omni VM dataset is a collection of pre-built virtual machine images for desktop agent benchmarking environments. The dataset consists of two main parts: Android AVD (Android Virtual Device) and Linux VMware images. The Android AVD exports AndroidWorldAvd and includes multiple benchmarking applications such as K-9 Mail, Delta Chat, LibreOffice Viewer, etc., along with detailed installation and configuration instructions. The Linux VMware images are cleaned, zero-filled, and compressed, containing a clean snapshot for benchmark resets and configured with applications required for running OS-Omni Linux tasks. The dataset also provides SHA256 checksums and manifest files for each file to ensure data integrity and verifiability.
创建时间:
2026-05-01
原始信息汇总

数据集概述:OS-Omni VM

基本信息

  • 数据集名称:OS-Omni VM
  • 许可证:MIT
  • 标签:os-omni, vmware, virtual-machine, benchmark, desktop-agents
  • 用途:提供OS-Omni桌面代理基准测试环境的预构建虚拟机镜像

数据集内容

数据集包含两类虚拟机镜像文件:

1. Android AVD

  • 文件android/AndroidWorldAvd_baseline_20260503.zip
  • 校验文件
    • android/AndroidWorldAvd_baseline_20260503.zip.sha256
    • android/AndroidWorldAvd_baseline_20260503_package_manifest.txt
    • android/AndroidWorldAvd_baseline_20260503_README.md
  • 预装应用:K-9 Mail、Delta Chat、LibreOffice Viewer、Tasks.org、Fossify应用、Organic Maps、Material Files、Markor、Oinkoin、Spotube及基准测试助手应用
  • 安装路径:解压至 %USERPROFILE%.androidavd
  • 配置要求:通信任务需要本地GreenMail服务(SMTP 3025、IMAP 3143、API 8081)
  • SHA256校验值70FE0C3DA09781C71F3BE4DEDAE9542F18B42F474A0C4688DE7DADF084E80A6E

2. Linux VM

  • 文件linux/os-omni-linux-ubuntu-x86-vm-20260502-compact.tar.zst
  • 校验文件
    • linux/os-omni-linux-ubuntu-x86-vm-20260502-compact.tar.zst.sha256
    • linux/os-omni-linux-ubuntu-x86-vm-20260502-compact.tar.zst.manifest.txt
  • 镜像说明:经过清理、零填充、压缩处理的Linux VMware Workstation镜像(包含Ubuntu-x86/),包含helloworld-clean快照用于基准测试重置
  • 预装应用:包含OS-Omni Linux任务执行所需的基准测试应用程序
  • 解压命令tar --use-compress-program=unzstd -xf linux/os-omni-linux-ubuntu-x86-vm-20260502-compact.tar.zst
  • 运行方式:使用VMware Workstation打开Ubuntu-x86/Ubuntu.vmx
  • SHA256校验值94ff210413ca7f2bfe8df9f867f43344d9b370a1cd8b8e0311b0303813a65d4b
搜集汇总
数据集介绍
main_image_url
构建方式
OS-Omni-VM数据集专为桌面智能体基准测试环境而设计,提供了预构建的虚拟机镜像资源。其构建方式涵盖两大核心组件:Android AVD归档文件与Linux VMware镜像。Android部分导出了名为AndroidWorldAvd的模拟器,预装K-9 Mail、Delta Chat、LibreOffice Viewer等基准应用及配套辅助程序。Linux镜像则经过清理、零填充与压缩优化,内置helloworld-clean快照用于基准重置,并在VMware配置中禁用了外部ISO/软盘引用,确保从打包的VMDK链直接启动。
特点
该数据集呈现高度标准化与即用性特征。Android AVD通过固定路径部署与配置文件修改实现环境快速重建,通信任务依赖本地GreenMail服务(SMTP 3025、IMAP 3143、API 8081)。Linux虚拟机采用zstd压缩格式与大文件清单管理,SHA256校验保障数据完整性。两大子集均聚焦桌面智能体评测场景,预装多样化开源应用生态,支持跨越移动端与桌面端的智能体任务执行复现。
使用方法
使用Android AVD时,需将压缩包解压至%USERPROFILE%\.android\avd\目录,确保AndroidWorldAvd.avd与AndroidWorldAvd.ini文件存在,并编辑ini文件中的path指向本地路径。Linux镜像通过tar --use-compress-program=unzstd命令解压,随后在VMware Workstation中打开Ubuntu-x86/Ubuntu.vmx文件,配合OS-Omni Linux基准运行器配置即可启动测评环境。两类镜像均提供清晰目录结构与校验机制,简化了复现流程。
背景与挑战
背景概述
OS-Omni VM数据集由研究团队于2026年5月左右创建,旨在为桌面智能体(desktop agents)基准测试提供标准化的虚拟化运行环境。该数据集涵盖Android模拟器与Linux虚拟机两大子集,预装了K-9 Mail、LibreOffice Viewer、Organic Maps等广泛使用的开源应用,以模拟真实用户操作场景。其核心研究问题聚焦于评估自主智能体在跨平台桌面环境中的任务执行能力,填补了现有基准测试中虚拟环境标准化程度不足的空白。作为OS-Omni项目的重要组成部分,该数据集通过提供即开即用的镜像快照与重置机制,显著降低了桌面智能体研究的复现门槛,对智能体任务规划、视觉理解与交互控制等下游方向具有基础性推动作用。
当前挑战
该数据集所应对的领域核心挑战在于桌面级自主智能体任务的高度复杂性——不同于受限的Web或移动端场景,桌面环境包含多窗口、跨应用协作、文件系统操作及异构平台(Android/Linux)交互,对智能体的状态感知与操作泛化能力提出严苛要求。构建过程中则面临双重技术难点:一方面需在虚拟机镜像中预装并维护十余款真实应用的兼容性,确保各应用版本在基准测试周期内保持稳定;另一方面要完成磁盘文件的零填充压缩与快照管理,在保证VMware Workstation跨版本可用性的同时,优化存储体积与解压效率以支持大规模分布式测试部署。
常用场景
经典使用场景
OS-Omni VM数据集是专为桌面智能体(Desktop Agents)基准测试而构建的虚拟机镜像集合,其经典使用场景在于为跨平台桌面自动化任务提供一个标准化、可复现的评估环境。该数据集涵盖基于Android的AVD镜像与Linux Ubuntu的VMware镜像,预装了大量真实的应用程序,如邮件客户端(K-9 Mail、Delta Chat)、文档查看器(LibreOffice Viewer)、地图导航(Organic Maps)及记账工具(Oinkoin)等。研究者可直接在预先配置好的虚拟机上执行操作任务,从而实现从点击、输入到多应用协作的端到端测试。这一设计极大降低了环境搭建的复杂度,使得不同团队能够在完全一致的计算状态下比较智能体的性能,为桌面自动化领域的可重复性研究奠定了坚实基础。
解决学术问题
该数据集有效解决了桌面智能体研究中长期存在的环境配置差异大、基准测试难以复现的学术难题。以往的研究常因测试系统版本、应用安装状态或网络服务配置不一致而导致结果偏差,OS-Omni VM通过提供经过标准化封装的虚拟机快照和精确的校验机制,为多模态智能体的操作能力评估提供了统一标尺。其内置的Android和Linux双平台支持,使得跨操作系统智能体的泛化性能得以系统性验证。这一贡献推动了智能体从静态问答走向动态交互的学术范式转变,促进了对智能体在真实软件生态中决策与纠错能力的深度理解,对整个AI领域建立更加严谨的评估体系具有里程碑式的意义。
衍生相关工作
基于OS-Omni VM数据集,学术界与工业界衍生出了一系列代表性工作。在基准测试方面,研究者以其为基础构建了面向多平台桌面操作的任务集,并据此提出了新的智能体动作空间建模方法。部分工作致力于优化智能体在虚拟机中的感知与长程规划能力,利用该数据集的快照重置机制实现了大规模强化学习训练。此外,还有团队借鉴其镜像封装思路,将其拓展至macOS与Windows平台的虚拟环境构建,形成了跨操作系统的统一评估框架。这些衍生工作不仅验证了预置虚拟机范式在桌面自动化研究中的普适性,也推动了从单应用指令执行到多应用协作任务的复杂性层次跃迁,持续丰富着智能体研究的方法论体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作