five

WayBED

收藏
arXiv2025-08-28 更新2025-08-30 收录
下载链接:
https://github.com/im-ethz/DigitalScale
下载链接
链接失效反馈
官方服务:
资源简介:
WayBED数据集是一个大规模的真实世界数据集,包含来自25,353个人的超过84,000张全身照片。该数据集是作为WayBetter减肥计划的一部分收集的,用于估计身体质量指数(BMI)。数据集通过使用姿势聚类和人物检测的自动过滤方法进行筛选,以去除低质量图像。该数据集用于训练一个基于深度学习的BMI估计模型,该模型在WayBED测试集上实现了7.9%的平均绝对百分比误差(MAPE)。该模型在真实世界场景中具有广泛的应用,例如远程设置或紧急护理中,当传统方法不可用或不切实际时,可以快速评估体重。

The WayBED dataset is a large-scale real-world dataset containing over 84,000 full-body photos from 25,353 individuals. It was collected as part of the WayBetter weight loss program for body mass index (BMI) estimation. The dataset was filtered via automatic filtering methods that employ pose clustering and human detection to remove low-quality images. This dataset was used to train a deep learning-based BMI estimation model, which achieved a mean absolute percentage error (MAPE) of 7.9% on the WayBED test set. This model has broad applications in real-world scenarios such as remote settings or emergency care, enabling rapid weight assessment when traditional methods are unavailable or impractical.
提供机构:
ETH Zurich, University of St.Gallen, WayBetter
创建时间:
2025-08-28
原始信息汇总

Digital Scale 数据集概述

数据集基本信息

  • 名称:Digital Scale
  • 主要功能:基于智能手机摄像头图像进行设备端身体质量指数(BMI)估计
  • 开发机构:苏黎世联邦理工学院数字健康干预中心、圣加仑大学数字健康干预中心、WayBetter公司
  • 数据规模:84,963张智能手机图像(来自25,353名个体)
  • 高质量数据子集:71,322张图像(经过自动过滤处理)

核心数据集详情

WayBED数据集

  • 性质:大规模专有数据集
  • 图像类型:智能手机拍摄的全身体图像
  • 过滤方法:采用姿态聚类和人物检测的自动过滤技术,去除低质量图像(非典型姿态或不完整视图)

技术性能指标

模型性能

  • WayBED测试集表现:平均绝对百分比误差(MAPE)7.9%
  • VisualBodyToBMI数据集表现:MAPE 13%(训练期间完全未见的数据集)
  • 泛化能力:与在该数据集上训练的最先进方法相当

部署与应用

  • 部署框架:CLAID框架(用于Android设备部署)
  • 功能范围:完整管道部署,包括图像过滤和BMI估计
  • 实时能力:支持现代GPU上的实时推理
  • 兼容性:支持无GPU环境的CPU兼容

代码资源结构

主要目录

  • app/:Android应用实现(使用CLAID进行实时BMI估计)
  • docs/:文档文件
  • get_started/:快速入门指南(最小化BMI预测设置)
  • src/:源代码
  • src/scripts:训练、评估和部署脚本
  • trained_models/keypoint_models/:预训练关键点模型(用于姿态聚类)

核心脚本分类

模型训练与部署

  • 训练脚本:支持并行GPU训练和不同模型架构
  • 评估脚本:多模型评估和系统性能分析
  • 部署脚本:使用CLAID框架的完整BMI估计管道

预处理与过滤

  • 姿态聚类训练:使用关键点数据训练聚类模型
  • 姿态预测:从原始关键点数据预测姿态聚类
  • 边界框检测:人物区域识别和质量评估
  • 数据集解析:从文件名提取元数据(体重、身高、性别)

使用要求

  • 模型权重:需联系作者获取(rmanichand@ethz.ch 或 planger@ethz.ch)
  • 依赖安装:通过pip安装requirements.txt指定依赖
  • 快速开始:提供get_started文件夹简化设置流程

开源贡献

  • 完整代码开源:包括模型训练、过滤和移动部署的CLAID包
  • 预训练模型:提供关键点模型用于姿态聚类
  • 文档资料:包含完整设置说明和故障排除指南
搜集汇总
数据集介绍
main_image_url
构建方式
在数字健康监测领域,WayBED数据集的构建采用了严谨的多阶段质量控制流程。该数据集源自WayBetter体重管理项目的真实用户参与,通过智能手机摄像头采集了84,963张全身图像,覆盖25,353名受试者。构建过程中实施了自动化过滤机制,基于Detectron2框架进行人体边界框检测和关键点估计,通过姿态聚类(K-means算法结合PCA降维)剔除非常规姿势图像,同时设置人物检测置信度和人物背景比例阈值,最终保留71,322张高质量图像用于模型训练。
特点
该数据集的核心特征体现在其规模性与真实性维度。作为当前最大的BMI估计专用数据集,其图像数量达到84,963张,远超现有同类数据集规模。数据来源具有显著的真实世界特性,图像由用户使用不同型号智能手机在非受控环境下采集,涵盖了自然光照、多样背景和日常服饰等现实场景变量。数据集同时提供全身、躯干和面部三种视角的图像裁剪,并包含经过人工核验的体重标签与自报身高数据,为多视角BMI估计研究提供了完备基准。
使用方法
该数据集主要用于训练和评估基于深度学习的BMI估计模型。研究人员可通过提取全身、躯干和面部三种视角的图像输入DenseNet架构模型进行训练,其中全身视角表现最优(MAPE 7.9%)。数据集支持跨数据集泛化验证,可在VisualBodyToBMI等外部数据集测试模型性能。部署时可采用CLAID框架集成图像过滤和模型推断模块,实现端到端的移动端BMI估计流程。所有训练代码和移动部署方案均已开源,支持研究者进行模型微调和实际应用部署。
背景与挑战
背景概述
WayBED数据集由苏黎世联邦理工学院数字健康干预中心与WayBetter公司于2025年联合创建,旨在通过智能手机图像实现无接触式体重指数估算。该数据集包含来自25,353名参与者的84,963张真实场景全身图像,聚焦于解决远程医疗和急救场景中传统测量设备缺失时的健康监测难题。其创新性在于采用自动化姿态聚类与质量过滤流程,构建了当时规模最大的BMI估算图像数据集,为数字健康领域的计算机视觉应用提供了重要基准。
当前挑战
在领域问题层面,BMI估算需克服因拍摄角度、光照条件和人体姿态多样性引起的特征提取复杂性,同时需保证跨设备、跨场景的模型泛化能力。构建过程中面临三大挑战:一是原始图像中存在16.2%的低质量数据需通过姿态聚类和比例阈值进行过滤;二是自报告体重身高数据可能存在系统误差;三是隐私保护要求限制了数据公开方式,需通过严格授权机制实现研究用途的数据共享。
常用场景
经典使用场景
在远程医疗和健康监测领域,WayBED数据集通过智能手机拍摄的全身图像为BMI估算提供了大规模真实世界数据支持。该数据集广泛应用于深度学习模型的训练与验证,特别是在缺乏传统测量设备的场景下,如紧急医疗救助或家庭健康管理,研究人员利用其高质量图像数据开发高精度BMI预测算法。
解决学术问题
WayBED数据集解决了计算机视觉中BMI估算的数据规模限制问题,此前研究多依赖小规模或单视角图像。该数据集通过自动过滤机制剔除低质量图像,并提供多视角一致性数据,显著提升了模型的泛化能力和跨数据集适应性,为肥胖相关慢性疾病的早期筛查提供了可靠技术基础。
衍生相关工作
基于WayBED数据集衍生的经典工作包括采用DenseNet-201架构与挤压激励注意力机制的BMI预测模型,其移动端部署框架CLAID实现了端到端的图像处理流水线。相关研究进一步推动了多视角图像融合技术发展,并在VisualBodyToBMI等基准数据集上实现了8.56%的MAPE突破,为后续跨模态健康分析研究奠定基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作