logasja/FDF

Name: logasja/FDF
Creator: logasja
Published: 2024-05-28 21:16:34
License: 暂无描述

Hugging Face2024-05-28 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/logasja/FDF

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: - config_name: default features: - name: image dtype: image - name: landmarks struct: - name: nose struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: bbox struct: - name: x_min dtype: uint16 - name: y_min dtype: uint16 - name: x_max dtype: uint16 - name: y_max dtype: uint16 - name: metadata struct: - name: license dtype: string - name: photo_url dtype: string splits: - name: train num_bytes: 24947710877.238 num_examples: 241982 - name: validation num_bytes: 675281167.698 num_examples: 6531 download_size: 25546589444 dataset_size: 25622992044.935997 - config_name: fdf features: - name: image dtype: image - name: landmarks struct: - name: nose struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: bbox struct: - name: x_min dtype: uint16 - name: y_min dtype: uint16 - name: x_max dtype: uint16 - name: y_max dtype: uint16 - name: metadata struct: - name: license dtype: string - name: photo_url dtype: string splits: - name: train num_bytes: 39416677329.737 num_examples: 1421253 - name: validation num_bytes: 1394389688.0 num_examples: 50000 download_size: 40895711741 dataset_size: 40811067017.737 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - config_name: fdf data_files: - split: train path: fdf/train-* - split: validation path: fdf/validation-* ---

数据集信息： ### 配置1：default（默认配置） #### 特征字段： 1. `image`：数据类型为图像 2. `landmarks`（人脸关键点）：嵌套结构体，包含以下子字段： - `nose`（鼻子）：嵌套结构体，含`x`（x坐标）、`y`（y坐标），数据类型均为float32 - `r_eye`（右眼）：嵌套结构体，含`x`、`y`坐标，数据类型均为float32 - `l_eye`（左眼）：嵌套结构体，含`x`、`y`坐标，数据类型均为float32 - `r_ear`（右耳）：嵌套结构体，含`x`、`y`坐标，数据类型均为float32 - `l_ear`（左耳）：嵌套结构体，含`x`、`y`坐标，数据类型均为float32 - `r_shoulder`（右肩）：嵌套结构体，含`x`、`y`坐标，数据类型均为float32 - `l_shoulder`（左肩）：嵌套结构体，含`x`、`y`坐标，数据类型均为float32 3. `bbox`（边界框，bounding box）：嵌套结构体，包含以下子字段： - `x_min`（最小x坐标）：数据类型为uint16 - `y_min`（最小y坐标）：数据类型为uint16 - `x_max`（最大x坐标）：数据类型为uint16 - `y_max`（最大y坐标）：数据类型为uint16 4. `metadata`（元数据）：嵌套结构体，包含以下子字段： - `license`（许可证）：数据类型为字符串 - `photo_url`（图片链接）：数据类型为字符串 #### 数据集划分： - 训练集（train）：字节占用量为24947710877.238，样本总数为241982 - 验证集（validation）：字节占用量为675281167.698，样本总数为6531 #### 整体参数：下载总大小为25546589444，数据集总存储大小为25622992044.935997 ### 配置2：fdf #### 特征字段与默认配置完全一致： 1. `image`：数据类型为图像 2. `landmarks`（人脸关键点）：嵌套结构体，覆盖鼻子、右眼、左眼、右耳、左耳、右肩、左肩的x、y坐标，数据类型均为float32 3. `bbox`（边界框，bounding box）：嵌套结构体，包含`x_min`、`y_min`、`x_max`、`y_max`，数据类型均为uint16 4. `metadata`（元数据）：嵌套结构体，包含`license`（许可证）与`photo_url`（图片链接），数据类型均为字符串 #### 数据集划分： - 训练集（train）：字节占用量为39416677329.737，样本总数为1421253 - 验证集（validation）：字节占用量为1394389688.0，样本总数为50000 #### 整体参数：下载总大小为40895711741，数据集总存储大小为40811067017.737 ### 配置项： 1. 配置名称：default，数据文件路径： - 训练集：`data/train-*` - 验证集：`data/validation-*` 2. 配置名称：fdf，数据文件路径： - 训练集：`fdf/train-*` - 验证集：`fdf/validation-*`

提供机构：

logasja

原始信息汇总

数据集概述

配置 `default`

特征:
- image: 图像数据类型
- landmarks: 结构化特征，包括以下子特征:
  - nose: 包含 x 和 y 坐标，数据类型为 float32
  - r_eye: 包含 x 和 y 坐标，数据类型为 float32
  - l_eye: 包含 x 和 y 坐标，数据类型为 float32
  - r_ear: 包含 x 和 y 坐标，数据类型为 float32
  - l_ear: 包含 x 和 y 坐标，数据类型为 float32
  - r_shoulder: 包含 x 和 y 坐标，数据类型为 float32
  - l_shoulder: 包含 x 和 y 坐标，数据类型为 float32
- bbox: 包含边界框坐标，数据类型为 uint16
- metadata: 包含 license 和 photo_url，数据类型为 string
分割:
- train: 241982 个样本，占用 24947710877.238 字节
- validation: 6531 个样本，占用 675281167.698 字节
下载大小: 25546589444 字节
数据集大小: 25622992044.935997 字节

配置 `fdf`

特征:
- image: 图像数据类型
- landmarks: 结构化特征，包括以下子特征:
  - nose: 包含 x 和 y 坐标，数据类型为 float32
  - r_eye: 包含 x 和 y 坐标，数据类型为 float32
  - l_eye: 包含 x 和 y 坐标，数据类型为 float32
  - r_ear: 包含 x 和 y 坐标，数据类型为 float32
  - l_ear: 包含 x 和 y 坐标，数据类型为 float32
  - r_shoulder: 包含 x 和 y 坐标，数据类型为 float32
  - l_shoulder: 包含 x 和 y 坐标，数据类型为 float32
- bbox: 包含边界框坐标，数据类型为 uint16
- metadata: 包含 license 和 photo_url，数据类型为 string
分割:
- train: 1421253 个样本，占用 39416677329.737 字节
- validation: 50000 个样本，占用 1394389688.0 字节
下载大小: 40895711741 字节
数据集大小: 40811067017.737 字节

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，人脸数据集对于推动面部识别与姿态估计技术的发展至关重要。logasja/FDF数据集的构建依托于大规模图像采集与精细标注流程，其数据来源于公开图像资源，通过自动化与人工协同的方式，对每幅图像中的人脸关键点进行标注，涵盖鼻部、双眼、双耳及双肩等七个关键部位坐标，同时提供边界框信息。数据经过清洗与验证，划分为训练集与验证集，确保标注的一致性与准确性，为模型训练提供了结构化且可靠的数据基础。

特点

该数据集在面部分析研究中展现出显著特点，其核心在于提供了高精度的人脸关键点标注，每个样本均包含七个关键点的二维坐标，这些坐标以浮点数形式存储，支持细粒度的人脸姿态分析。数据集规模庞大，训练集包含超过24万样本，验证集约6500样本，且图像数据以原始格式保存，保留了丰富的视觉细节。此外，每个样本附带的元数据如许可协议和来源链接，增强了数据的可追溯性与合规性，适用于多样化的研究场景。

使用方法

在应用层面，logasja/FDF数据集主要用于训练和评估人脸关键点检测与姿态估计模型。研究人员可通过HuggingFace平台直接加载数据集，利用其标准化的图像与标注结构，快速集成到深度学习框架中。数据集支持两种配置，用户可根据需求选择默认或FDF配置，分别对应不同的数据子集。典型使用流程包括数据预处理、模型训练与验证，标注的边界框和关键点坐标可直接用于损失计算，推动面部分析技术的实证研究。

背景与挑战

背景概述

在计算机视觉领域，人脸数据处理一直是研究热点，尤其是随着生成对抗网络（GAN）等深度学习技术的兴起，人脸匿名化与隐私保护问题日益凸显。FDF数据集由Håkon Hukkelås、Rudolf Mester和Frank Lindseth等研究人员于2019年构建，其核心研究问题聚焦于通过生成模型实现人脸图像的匿名化处理，以应对隐私泄露风险。该数据集基于《DeepPrivacy: A Generative Adversarial Network for Face Anonymization》论文，旨在推动人脸隐私保护技术的发展，为生成模型在视觉隐私领域的应用提供了重要数据支撑，对计算机视觉与隐私计算的交叉研究产生了深远影响。

当前挑战

FDF数据集所解决的领域问题在于人脸匿名化，其挑战在于如何在保持图像真实感的同时彻底移除可识别特征，避免生成模型产生身份泄露或视觉伪影。构建过程中的挑战包括数据收集的合法性与伦理考量，需确保源图像符合隐私法规；标注环节需精确标定人脸关键点与边界框，以支撑模型训练，但大规模标注易引入噪声与不一致性；此外，数据多样性不足可能限制模型泛化能力，而匿名化效果的评估缺乏统一标准，增加了技术验证的复杂性。

常用场景

经典使用场景

在计算机视觉领域，人脸识别与姿态估计研究常依赖于高质量标注数据。FDF数据集以其丰富的面部关键点标注和边界框信息，为深度学习模型训练提供了坚实基础。该数据集经典应用于面部关键点检测算法的开发与评估，研究者利用其精确的鼻、眼、耳、肩等部位坐标，训练卷积神经网络以提升模型在复杂场景下的定位精度与鲁棒性。

衍生相关工作

围绕FDF数据集，学术界衍生了一系列经典研究工作。例如，基于其标注的DeepPrivacy框架实现了生成对抗网络在面部匿名化中的创新应用；同时，该数据集也促进了多任务学习模型的演进，如联合面部关键点检测与属性分析的端到端系统。这些工作不仅拓展了数据集的利用维度，还为隐私保护视觉计算设立了新的基准。

数据集最近研究

logasja/FDF

数据集概述

配置 default

配置 fdf

配置 `default`

配置 `fdf`