Wake Vision

Name: Wake Vision
Creator: 哈佛大学
Published: 2024-05-02 06:33:45
License: 暂无描述

arXiv2024-05-02 更新2024-06-24 收录

下载链接：

wakevision.ai

下载链接

链接失效反馈

官方服务：

资源简介：

Wake Vision是一个专为TinyML人体检测任务设计的大型多样化数据集，由哈佛大学等机构创建。该数据集包含超过600万张图像，比之前的标准数据集大100倍，并经过了严格的质量筛选。数据集的内容涵盖了多种场景和条件，如不同的光照、距离和人群特征，以确保模型在实际环境中的鲁棒性和公平性。创建过程中，数据集从Open Images v7数据集中提取，并根据CC-BY 4.0许可公开发布，支持商业用途。Wake Vision旨在解决TinyML领域中数据集大小和质量限制的问题，推动该领域的研究和应用发展。

Wake Vision is a large-scale diverse dataset specifically designed for TinyML human detection tasks, created by institutions including Harvard University and others. It contains over 6 million images, which is 100 times larger than previous standard datasets, and has undergone rigorous quality filtering. The dataset covers a wide variety of scenarios and conditions, such as varying lighting, shooting distances, and diverse crowd characteristics, to ensure the robustness and fairness of models in real-world deployment scenarios. The dataset was extracted from the Open Images v7 dataset during its creation, and is publicly released under the CC-BY 4.0 license, supporting commercial usage. Wake Vision aims to address the constraints of dataset size and quality in the TinyML domain, and promote the research and application development of this field.

提供机构：

哈佛大学

创建时间：

2024-05-02

搜集汇总

数据集介绍

构建方式

在微型机器学习领域，数据集的构建需兼顾资源受限设备的实际应用需求。Wake Vision数据集专为TinyML人物检测任务设计，其构建过程强调规模与多样性。该数据集通过采集大规模、多样化的视觉场景，涵盖不同环境、光照及人物姿态，确保数据能够反映真实世界复杂性。数据经过精心标注，提供高质量的人物检测标签，同时优化存储格式以适应微型硬件的内存限制，为后续的神经架构搜索提供可靠基础。

特点

Wake Vision数据集的特点在于其规模与复杂性显著超越传统TinyML数据集。它包含大量高分辨率图像，覆盖广泛场景，增强了模型在边缘设备上的泛化能力。数据集特别注重资源效率，支持多种数据配置选项，如分辨率调整和色彩编码选择，便于在搜索过程中探索数据与模型架构的协同优化。这些特性使其成为评估数据感知神经架构搜索算法的理想基准，推动了TinyML系统在性能与效率上的平衡研究。

使用方法

使用Wake Vision数据集时，研究者可将其应用于数据感知神经架构搜索框架中。首先，数据集被加载并预处理，以适应不同的输入配置，例如调整图像分辨率或切换单色与RGB模式。随后，结合超级网络技术，在搜索空间中联合优化数据配置与模型架构，通过遗传算法评估系统在资源约束下的性能。最终，数据集支持生成帕累托最优的TinyML系统，为人物检测等实际应用提供高效解决方案，同时简化了跨不同硬件平台的部署流程。

背景与挑战

背景概述

Wake Vision数据集作为微型机器学习领域的一项新兴资源，由丹麦技术大学与微软研究院的研究团队于2024年联合推出，旨在为资源受限的嵌入式设备提供大规模、高质量的人员检测基准。该数据集的核心研究问题聚焦于如何在极端的计算、内存与能耗约束下，实现高效且准确的人员检测模型优化，从而推动TinyML在实际场景中的广泛应用。通过结合数据感知神经架构搜索技术，Wake Vision不仅扩展了传统硬件感知NAS的范畴，还显著提升了模型在复杂视觉任务中的性能与效率，为边缘智能系统的设计与部署提供了关键的数据支撑。

当前挑战

Wake Vision数据集所应对的核心挑战在于解决微型机器学习中人员检测任务的高效优化问题，即在严格资源限制下平衡模型精度与系统开销。具体而言，该挑战涉及如何在输入数据配置（如图像分辨率与色彩模式）与神经网络架构之间寻求最优协同，以降低内存占用与计算负载，同时保持较高的检测准确性。在数据集构建过程中，研究人员面临数据规模与复杂性的双重压力：需采集多样化、高质量的人员图像以覆盖真实场景的变异性，并确保数据标注的精确性与一致性。此外，将大规模视觉数据适配到微型硬件平台，还需克服数据预处理、存储优化以及评估流程的效率瓶颈，这些因素共同构成了数据集开发与部署中的主要难点。

常用场景

经典使用场景

在微型机器学习领域，Wake Vision数据集作为一项大规模、多样化的视觉基准资源，其经典应用场景聚焦于资源受限环境下的人物检测任务。该数据集通过提供高分辨率的图像样本，支持研究者探索在内存、计算和能耗严格受限的微控制器设备上部署高效神经网络模型的可行性。其设计初衷在于弥补传统TinyML数据集在规模和复杂性上的不足，为数据感知神经架构搜索等前沿方法提供了验证平台，使得模型能够在输入数据配置与网络架构之间实现协同优化，从而在边缘设备上实现更精准的实时人物识别。

衍生相关工作

围绕Wake Vision数据集，一系列经典研究工作得以衍生，进一步拓展了微型机器学习的边界。其中，数据感知神经架构搜索方法的演进尤为突出，研究者们基于该数据集提出了超网络加速评估算法，大幅提升了联合搜索效率。相关工作还包括对MCUNet、Micronets等现有TinyML模型的适配与优化，以及在不同硬件平台上的跨资源约束验证。这些研究不仅巩固了数据集在人物检测领域的基准地位，还激发了关于可微分搜索空间设计、多维度硬件度量整合等方向的深入探索，为边缘智能系统的自动化设计奠定了理论基础。

数据集最近研究