five

ETHZurich/biwi_kinect_head_pose

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/ETHZurich/biwi_kinect_head_pose
下载链接
链接失效反馈
官方服务:
资源简介:
Biwi Kinect Head Pose Database是一个用于头部姿态估计的数据集,包含15K张图像,涉及20个人(6名女性和14名男性,其中4人被记录了两次)。数据集通过Microsoft Kinect传感器采集,每帧图像包括深度图像、对应的RGB图像以及注释信息。头部姿态范围覆盖了大约+-75度的偏航角和+-60度的俯仰角。数据集的真实标签包括头部的3D位置和旋转信息。数据集支持的任务包括头部姿态估计、姿态估计和人脸验证。

Biwi Kinect Head Pose Database是一个用于头部姿态估计的数据集,包含15K张图像,涉及20个人(6名女性和14名男性,其中4人被记录了两次)。数据集通过Microsoft Kinect传感器采集,每帧图像包括深度图像、对应的RGB图像以及注释信息。头部姿态范围覆盖了大约+-75度的偏航角和+-60度的俯仰角。数据集的真实标签包括头部的3D位置和旋转信息。数据集支持的任务包括头部姿态估计、姿态估计和人脸验证。
提供机构:
ETHZurich
原始信息汇总

数据集概述

名称: Biwi Kinect Head Pose Database

语言: 英语 (en)

许可证: 其他

多语言性: 单语

数据集大小: 10K<n<100K

源数据: 原始数据

任务类别: 其他

标签: 头部姿态估计

数据集结构

数据实例

  • sequence_number: 字符串类型,表示数据集中的序列号。
  • subject_id: 字符串类型,表示数据集中的个体ID。
  • rgb: 图像序列,包含RGB图像。
  • rgb_cal: 结构体,包含颜色相机的内参矩阵和外参矩阵(旋转和翻译)。
  • depth: 字符串序列,表示深度图像。
  • depth_cal: 结构体,包含深度相机的内参矩阵和外参矩阵(旋转和翻译)。
  • head_pose_gt: 序列,包含头部姿态的地面实况,包括头部中心的3D位置和旋转矩阵。
  • head_template: 字符串类型。

数据字段

  • sequence_number: 序列号。
  • subject_id: 个体ID。
  • rgb: RGB图像序列。
  • rgb_cal: 颜色相机的校准信息。
  • depth: 深度图像序列。
  • depth_cal: 深度相机的校准信息。
  • head_pose_gt: 头部姿态的地面实况。

数据分割

  • 训练集: 包含所有数据,共24个示例,总大小为6914063字节。

数据集创建

源数据

  • 数据收集: 使用Microsoft Kinect传感器收集,包含15K图像,涉及20人(6名女性,14名男性,其中4人记录两次)。

注释

  • 注释生成: 专家生成。

许可证信息

  • 使用限制: 该数据库仅供非商业用途,如大学研究和教育。
搜集汇总
数据集介绍
main_image_url
构建方式
ETHZurich/biwi_kinect_head_pose数据集是利用Microsoft Kinect传感器采集的,包含20个人的15K图像,其中有6名女性和14名男性,其中4人被记录了两次。每个序列均包含了深度图像、对应的RGB图像以及注释信息。数据集的构建旨在为头部姿态估计提供基准数据,涵盖了约+-75度的偏航角和+-60度的俯仰角范围,提供了头部的3D位置和旋转的地面真实数据。
使用方法
使用该数据集时,研究者可以加载序列编号、受试者ID、RGB图像、深度图像以及头部姿态的地面真实数据。数据集提供了C++示例代码,用于读取压缩的二进制深度图像文件和地面真实数据。用户需遵循数据集的非商业使用许可,如用于大学研究和教育。
背景与挑战
背景概述
ETHZurich/biwi_kinect_head_pose数据集,由ETH Zurich的研究团队于2013年创建,旨在为头部姿态估计领域提供高质量的研究资源。该数据集利用Microsoft Kinect传感器采集,包含了20个人的15K张图像,涵盖了不同性别及年龄层次。数据集中的头部姿态范围广泛,覆盖了约正负75度的偏航角和正负60度的俯仰角。每张图像都伴有深度信息和相应的RGB信息,以及精确的头部姿态标注,为研究人员提供了宝贵的一手资料。
当前挑战
ETHZurich/biwi_kinect_head_pose数据集在构建过程中遇到的挑战主要包括:1)确保头部姿态标注的精确性,这需要专业的知识和细致的工作;2)数据集的多样性有限,由于参与者数量和采集环境的限制,可能无法代表更广泛的人群和场景;3)数据集的规模相对较小,这可能限制其在大型模型训练中的应用。此外,数据集的使用限于非商业用途,如大学研究和教育,这可能在一定程度上限制了其应用范围。
常用场景
经典使用场景
ETHZurich/biwi_kinect_head_pose数据集,作为头部姿态估计领域的一项重要资源,其经典使用场景主要集中于学术研究和工业应用中的头部姿态检测与分析。该数据集提供了丰富的头部姿态图像及相应的深度信息,支持研究者在真实世界条件下进行头部姿态的识别与跟踪。
解决学术问题
该数据集解决了头部姿态估计中的多个学术问题,包括但不限于头部位置的精确识别、三维头部姿态的重建以及不同光照和遮挡条件下的姿态稳定性。其提供的标准数据标注和校准信息,为算法评估和性能比较提供了基准,极大推动了相关领域的研究进展。
实际应用
在实际应用中,ETHZurich/biwi_kinect_head_pose数据集可用于虚拟现实(VR)、增强现实(AR)、人机交互以及智能监控等场景,以实现更为自然和准确的人机交互体验。例如,在VR游戏中,该数据集可以帮助开发更为逼真的角色头部动作捕捉。
数据集最近研究
最新研究方向
ETHZurich/biwi_kinect_head_pose数据集是领域内用于头部姿态估计的重要资源,近期研究方向主要集中于深度学习模型在此数据集上的应用与优化,特别是在三维头部姿态估计和实时性能提升方面。研究者们探索了不同的网络架构和训练策略,以实现更高的准确度和鲁棒性。此外,结合多模态数据(如RGB-D信息)的研究亦受到关注,旨在增强模型在不同场景下的泛化能力。该数据集在人脸分析、虚拟现实和人机交互等领域的应用研究中扮演着重要角色。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作