five

XRZOO|扩展现实数据集|软件工程数据集

收藏
arXiv2024-12-11 更新2024-12-12 收录
扩展现实
软件工程
下载链接:
http://arxiv.org/abs/2412.06759v2
下载链接
链接失效反馈
资源简介:
XRZOO是一个大规模、多功能的扩展现实(XR)应用数据集,由香港中文大学等机构创建。该数据集包含12,528个免费XR应用,涵盖了AR、MR和VR技术,跨越九个应用商店,具有详细的元数据,如应用描述、类别、发布日期、用户评论数量和硬件规格等。数据集的创建过程涉及从多个主流市场收集数据,并通过自定义爬虫系统处理和规范化数据。XRZOO旨在支持XR软件工程和安全研究,促进跨学科研究,并为开发者提供高级XR系统的示例。
提供机构:
香港中文大学
创建时间:
2024-12-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
XRZOO数据集的构建基于对九个主流XR应用市场的全面爬取,涵盖了Meta Horizon Store、VIVEPORT、SideQuest、Vision Pro App Store、Steam、Microsoft Store、Google Play和iOS App Store等平台。通过自定义的分布式爬虫系统,研究人员克服了平台多样性、API支持不足以及数据格式不一致等挑战,确保了数据的全面性和高质量。最终,数据集包含了12,528个免费XR应用,涵盖了AR、MR和VR等多种技术,并附有详细的元数据,如应用描述、类别、发布日期、用户评论数量和硬件规格等。
特点
XRZOO数据集的显著特点在于其广泛的应用覆盖范围和多样化的平台支持。该数据集不仅包含了从多个主流XR应用市场中爬取的12,528个免费应用,还涵盖了从独立设备到PC辅助设备以及移动设备的多种XR设备类型。此外,数据集提供了丰富的元数据,包括应用描述、类别、发布日期、用户评论数量和硬件规格等,为研究者提供了全面的研究基础。
使用方法
XRZOO数据集可广泛应用于XR软件工程的多个研究领域,包括交互测试、缺陷检测、静态/动态分析、性能优化和用户体验研究等。研究者可以利用该数据集开发和验证自动化工具,进行跨平台的缺陷模式识别和隐私安全审计。此外,开发者可以通过该数据集进行应用性能基准测试,优化调试流程,并从跨平台的应用比较中汲取最佳实践。数据集还支持应用分类和用户行为分析,为XR应用的开发和维护提供了宝贵的资源。
背景与挑战
背景概述
随着扩展现实(XR)技术的迅猛发展,涵盖增强现实(AR)、混合现实(MR)和虚拟现实(VR)的应用逐渐成为元宇宙构建的基石。XRZOO数据集由香港中文大学的Shuqing Li、哈尔滨工业大学的Chenran Zhang和Cuiyun Gao,以及香港中文大学的Michael R. Lyu共同创建,旨在填补XR领域缺乏大规模、高质量应用数据集的空白。该数据集包含了12,528个免费XR应用,涵盖九个主流应用商店,涉及多种XR技术和应用场景,提供了详细的元数据,如应用描述、类别、发布日期、用户评论数量和硬件规格等。通过公开XRZOO数据集,研究者能够推动可重复的XR软件工程和安全研究,促进跨学科研究,并为开发者提供丰富的应用示例,从而提升XR应用的可扩展性、可用性和有效性。
当前挑战
XRZOO数据集的构建面临多重挑战。首先,XR平台的多样性导致数据收集过程中需要复杂的过滤算法来识别XR应用,尤其是在通用应用商店中,XR应用往往缺乏明确的分类标签。其次,数据爬取过程中,许多平台缺乏API支持,且存在访问限制,这要求开发自定义的分布式爬取系统以规避速率限制。此外,不同平台间的元数据格式不一致,增加了数据聚合和标准化处理的难度。最后,确保数据的质量、完整性和准确性也是一大挑战,尤其是在处理多样化的XR平台和应用生态时。这些挑战共同构成了XRZOO数据集构建过程中的主要障碍。
常用场景
经典使用场景
XRZOO数据集的经典使用场景主要集中在扩展现实(XR)应用的软件工程研究中。该数据集通过提供12,528个来自九个主流应用商店的免费XR应用,涵盖了AR、MR和VR等多种技术,支持从应用描述、分类、发布日期到用户评论数量和硬件规格等详细元数据的研究。这些数据为研究人员提供了丰富的资源,用于开发和测试自动化工具,进行交互式测试、缺陷检测、静态和动态分析等,从而提升XR应用的质量和安全性。
衍生相关工作
XRZOO数据集的发布催生了一系列相关研究工作。例如,研究人员利用该数据集开发了自动化交互测试工具,针对XR环境的复杂性和实时交互特性进行了优化。此外,XRZOO还支持了缺陷检测和隐私安全审计的研究,通过静态和动态分析技术,识别和解决XR应用中的潜在问题。这些研究不仅提升了XR应用的质量,还为未来的XR软件工程研究奠定了坚实的基础。
数据集最近研究
最新研究方向
随着扩展现实(XR)技术的迅猛发展,XRZOO数据集作为首个大规模、多平台、多类别的XR应用数据集,为该领域的研究提供了坚实的基础。该数据集涵盖了从增强现实(AR)、虚拟现实(VR)到混合现实(MR)的广泛应用,跨越九大主流应用商店,包含12,528个免费应用及其详细的元数据。这一数据集不仅支持软件工程领域的研究,如自动化测试、缺陷检测和性能分析,还为跨学科研究提供了丰富的资源。特别是在隐私与安全审计、应用分类和用户体验研究等方面,XRZOO展现了其独特的价值。通过提供全面的XR应用生态系统数据,XRZOO为推动XR软件的可靠性、效率和创新提供了重要支持,成为该领域研究的前沿工具。
相关研究论文
  • 1
    XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications香港中文大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国裁判文书网

中国裁判文书网是中国最高人民法院设立的官方网站,旨在公开各级法院的裁判文书。该数据集包含了大量的法律文书,如判决书、裁定书、调解书等,涵盖了民事、刑事、行政、知识产权等多个法律领域。

wenshu.court.gov.cn 收录

UCM-Captions, Sydney-Captions, RSICD, RSITMD, NWPU-Captions, RS5M, SkyScript

UCM-Captions: 包含613张图像,分辨率为256×256。Sydney-Captions: 包含2,100张图像,分辨率为500×500。RSICD: 包含10,921张图像,分辨率为224×224。RSITMD: 包含4,743张图像,分辨率为256×256。NWPU-Captions: 包含31,500张图像,分辨率为256×256。RS5M: 包含超过500万张图像,分辨率为所有可能的分辨率。SkyScript: 包含520万张图像,分辨率为所有可能的分辨率。

github 收录

Tropicos

Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。

www.tropicos.org 收录

ReferCOCO数据集

ReferCOCO数据集包括refcoco、refcoco+和refcocog三个子集,用于视觉定位任务。数据集包含图像和对应的描述性文本,用于训练和测试模型识别图像中特定对象的能力。

github 收录

DAT

DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。

github 收录