PhotoData_Zeval

Hugging Face2025-10-30 更新2025-10-31 收录

下载链接：

https://huggingface.co/datasets/Mashmaro/PhotoData_Zeval

下载链接

链接失效反馈

官方服务：

资源简介：

PhotoData_Zeval数据集是由Unity环境合成的图像及其对应的姿态信息组成，主要用于机器人技术和仿真环境中的姿态估计和物体识别研究。该数据集原始的PNG图像已转换为JPEG格式，并压缩至一个ZIP文件中，包含约30万枚图像，分布在288个不同的视点，每个视点包含114枚图像，总计32832枚图像。每个图像文件夹中还有一个包含姿态等元数据的CSV文件。

创建时间：

2025-10-24

原始信息汇总

PhotoData_Zeval 数据集概述

数据集简介

该数据集由Unity环境合成的图像及对应的姿态信息（姿势数据）构成
主要面向机器人和仿真环境中的姿态估计与物体识别研究
原始约10GB的PNG图像已转换为JPEG格式，大幅减小数据尺寸

数据规格

文件格式：JPEG (.jpg) 和 CSV (.csv)
数据大小：约666 MB
图像数量：约30万枚
存储方式：单ZIP文件格式

数据结构

数据集以单个ZIP文件PhotoData.zip提供，解压后保持原始文件夹结构：

/JPEG_OUTPUT ├── /CapturedFrames_-1.0_1.0_-3.0 │ ├── data.csv │ ├── frame_0001.jpg │ └── frame_0002.jpg └── /CapturedFrames_...（其他多个子文件夹）

数据内容特征

每个图像对应一个data.csv文件，包含姿态信息和元数据
记录了Y_bot（Unity人形角色）从(0,0,-3)到(0,0,3)直线行走的动画
从288个不同视角进行拍摄，每个视角114张图像
总计288×114=32,832张图像数据

使用说明

需手动下载ZIP文件并解压使用
不支持标准的Hugging Face load_dataset函数直接加载
下载示例代码： python from huggingface_hub import hf_hub_download file_path = hf_hub_download( repo_id="Mashmaro/PhotoData_Zeval", filename="PhotoData.zip", repo_type="dataset" )

许可证

MIT License

数据预览

包含样本图像：sample1.jpg、sample2.jpg、sample3.jpg

详细说明

更多技术细节参见：https://huggingface.co/datasets/Mashmaro/PhotoData_Zeval/blob/main/Detail.md

搜集汇总

数据集介绍

构建方式

在计算机视觉与运动追踪研究领域，PhotoData_Zeval数据集通过Unity引擎合成生成，采用虚拟环境下的多角度拍摄策略。该数据集将原始约10GB的PNG格式图像转换为JPEG格式，并整合为单一ZIP文件存储，显著优化存储效率。数据采集过程中，通过控制虚拟人形模型沿直线路径运动，从288个固定视点以均匀间隔捕获图像，每个视点包含114帧，最终形成总计约32,832张图像及其对应姿态元数据的结构化集合。

特点

本数据集的核心特点体现在其高密度多视角结构与精细化标注体系。所有图像均附带CSV格式的元数据文件，完整记录每帧对应的三维姿态坐标与运动参数。数据规模紧凑而丰富，总计约666MB的存储空间容纳近30万张图像，兼具轻量化与高可用性。其合成数据特性确保了标注绝对精确，且通过标准化压缩格式保障了跨平台兼容性，为姿态估计与仿真训练研究提供高度可控的实验基础。

使用方法

针对该数据集的加载流程，需采用分步解压访问机制。用户需首先通过Hugging Face Hub接口下载完整ZIP文件，随后在本地环境中解压缩以还原层级目录结构。解压后的文件树包含按实验配置分组的子文件夹，每组内部分别存储JPEG图像序列与关联的CSV元数据表。研究者可通过自定义数据加载器读取图像帧及其对应姿态标注，进而构建适用于计算机视觉模型的训练或验证流水线。

背景与挑战

背景概述

PhotoData_Zeval数据集由Unity环境合成生成，专注于计算机视觉与机器人学领域的姿态估计研究。该数据集由研究机构在仿真技术蓬勃发展的背景下创建，旨在通过合成图像与对应姿态数据，解决真实世界数据采集成本高昂的问题。其核心研究问题聚焦于多视角人体运动跟踪与三维姿态重建，为机器人感知和虚拟交互系统提供了关键训练资源，显著推动了仿真驱动计算机视觉方法的进展。

当前挑战

该数据集致力于应对真实环境中人体姿态估计的视角变异和运动连续性建模难题，其构建过程面临双重挑战：原始数据规模庞大，需通过格式转换与压缩策略平衡存储效率与信息完整性；同时，多视角同步采集与数据标注的一致性保障，要求精密的仿真流程设计与元数据结构化处理，以确保姿态信息与图像序列的精确对应。

常用场景

经典使用场景

在计算机视觉与机器人技术领域，PhotoData_Zeval数据集通过Unity环境合成的多视角图像与对应姿态数据，为姿态估计研究提供了标准化基准。该数据集模拟了人类角色在三维空间中的直线行走动作，从288个不同视角捕捉了超过3万张图像，每张图像均附带精确的CSV格式姿态标注。这种结构化数据使得研究者能够系统评估算法在不同观察角度下的鲁棒性，尤其适用于仿真环境中人体运动分析的模型训练与验证。

衍生相关工作

围绕该数据集衍生的经典研究包括多传感器融合的姿态重建算法，如结合MediaPipe框架的实时运动捕捉系统。部分工作探索了基于生成对抗网络的域自适应方法，将合成数据特征映射至真实场景。此外，该数据集的标准化格式促进了Unity-MLAgents等仿真平台与深度学习框架的集成研究，催生了面向机器人视觉的端到端训练管线，为具身智能领域的仿真到现实迁移提供了关键范式。

数据集最近研究