logasja/FDF
收藏Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/logasja/FDF
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: default
features:
- name: image
dtype: image
- name: landmarks
struct:
- name: nose
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: r_eye
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: l_eye
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: r_ear
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: l_ear
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: r_shoulder
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: l_shoulder
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: bbox
struct:
- name: x_min
dtype: uint16
- name: y_min
dtype: uint16
- name: x_max
dtype: uint16
- name: y_max
dtype: uint16
- name: metadata
struct:
- name: license
dtype: string
- name: photo_url
dtype: string
splits:
- name: train
num_bytes: 24947710877.238
num_examples: 241982
- name: validation
num_bytes: 675281167.698
num_examples: 6531
download_size: 25546589444
dataset_size: 25622992044.935997
- config_name: fdf
features:
- name: image
dtype: image
- name: landmarks
struct:
- name: nose
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: r_eye
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: l_eye
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: r_ear
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: l_ear
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: r_shoulder
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: l_shoulder
struct:
- name: x
dtype: float32
- name: y
dtype: float32
- name: bbox
struct:
- name: x_min
dtype: uint16
- name: y_min
dtype: uint16
- name: x_max
dtype: uint16
- name: y_max
dtype: uint16
- name: metadata
struct:
- name: license
dtype: string
- name: photo_url
dtype: string
splits:
- name: train
num_bytes: 39416677329.737
num_examples: 1421253
- name: validation
num_bytes: 1394389688.0
num_examples: 50000
download_size: 40895711741
dataset_size: 40811067017.737
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- config_name: fdf
data_files:
- split: train
path: fdf/train-*
- split: validation
path: fdf/validation-*
---
数据集信息:
### 配置1:default(默认配置)
#### 特征字段:
1. `image`:数据类型为图像
2. `landmarks`(人脸关键点):嵌套结构体,包含以下子字段:
- `nose`(鼻子):嵌套结构体,含`x`(x坐标)、`y`(y坐标),数据类型均为float32
- `r_eye`(右眼):嵌套结构体,含`x`、`y`坐标,数据类型均为float32
- `l_eye`(左眼):嵌套结构体,含`x`、`y`坐标,数据类型均为float32
- `r_ear`(右耳):嵌套结构体,含`x`、`y`坐标,数据类型均为float32
- `l_ear`(左耳):嵌套结构体,含`x`、`y`坐标,数据类型均为float32
- `r_shoulder`(右肩):嵌套结构体,含`x`、`y`坐标,数据类型均为float32
- `l_shoulder`(左肩):嵌套结构体,含`x`、`y`坐标,数据类型均为float32
3. `bbox`(边界框,bounding box):嵌套结构体,包含以下子字段:
- `x_min`(最小x坐标):数据类型为uint16
- `y_min`(最小y坐标):数据类型为uint16
- `x_max`(最大x坐标):数据类型为uint16
- `y_max`(最大y坐标):数据类型为uint16
4. `metadata`(元数据):嵌套结构体,包含以下子字段:
- `license`(许可证):数据类型为字符串
- `photo_url`(图片链接):数据类型为字符串
#### 数据集划分:
- 训练集(train):字节占用量为24947710877.238,样本总数为241982
- 验证集(validation):字节占用量为675281167.698,样本总数为6531
#### 整体参数:
下载总大小为25546589444,数据集总存储大小为25622992044.935997
### 配置2:fdf
#### 特征字段与默认配置完全一致:
1. `image`:数据类型为图像
2. `landmarks`(人脸关键点):嵌套结构体,覆盖鼻子、右眼、左眼、右耳、左耳、右肩、左肩的x、y坐标,数据类型均为float32
3. `bbox`(边界框,bounding box):嵌套结构体,包含`x_min`、`y_min`、`x_max`、`y_max`,数据类型均为uint16
4. `metadata`(元数据):嵌套结构体,包含`license`(许可证)与`photo_url`(图片链接),数据类型均为字符串
#### 数据集划分:
- 训练集(train):字节占用量为39416677329.737,样本总数为1421253
- 验证集(validation):字节占用量为1394389688.0,样本总数为50000
#### 整体参数:
下载总大小为40895711741,数据集总存储大小为40811067017.737
### 配置项:
1. 配置名称:default,数据文件路径:
- 训练集:`data/train-*`
- 验证集:`data/validation-*`
2. 配置名称:fdf,数据文件路径:
- 训练集:`fdf/train-*`
- 验证集:`fdf/validation-*`
提供机构:
logasja
原始信息汇总
数据集概述
配置 default
- 特征:
image: 图像数据类型landmarks: 结构化特征,包括以下子特征:nose: 包含x和y坐标,数据类型为float32r_eye: 包含x和y坐标,数据类型为float32l_eye: 包含x和y坐标,数据类型为float32r_ear: 包含x和y坐标,数据类型为float32l_ear: 包含x和y坐标,数据类型为float32r_shoulder: 包含x和y坐标,数据类型为float32l_shoulder: 包含x和y坐标,数据类型为float32
bbox: 包含边界框坐标,数据类型为uint16metadata: 包含license和photo_url,数据类型为string
- 分割:
train: 241982 个样本,占用 24947710877.238 字节validation: 6531 个样本,占用 675281167.698 字节
- 下载大小: 25546589444 字节
- 数据集大小: 25622992044.935997 字节
配置 fdf
- 特征:
image: 图像数据类型landmarks: 结构化特征,包括以下子特征:nose: 包含x和y坐标,数据类型为float32r_eye: 包含x和y坐标,数据类型为float32l_eye: 包含x和y坐标,数据类型为float32r_ear: 包含x和y坐标,数据类型为float32l_ear: 包含x和y坐标,数据类型为float32r_shoulder: 包含x和y坐标,数据类型为float32l_shoulder: 包含x和y坐标,数据类型为float32
bbox: 包含边界框坐标,数据类型为uint16metadata: 包含license和photo_url,数据类型为string
- 分割:
train: 1421253 个样本,占用 39416677329.737 字节validation: 50000 个样本,占用 1394389688.0 字节
- 下载大小: 40895711741 字节
- 数据集大小: 40811067017.737 字节
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,人脸数据集对于推动面部识别与姿态估计技术的发展至关重要。logasja/FDF数据集的构建依托于大规模图像采集与精细标注流程,其数据来源于公开图像资源,通过自动化与人工协同的方式,对每幅图像中的人脸关键点进行标注,涵盖鼻部、双眼、双耳及双肩等七个关键部位坐标,同时提供边界框信息。数据经过清洗与验证,划分为训练集与验证集,确保标注的一致性与准确性,为模型训练提供了结构化且可靠的数据基础。
特点
该数据集在面部分析研究中展现出显著特点,其核心在于提供了高精度的人脸关键点标注,每个样本均包含七个关键点的二维坐标,这些坐标以浮点数形式存储,支持细粒度的人脸姿态分析。数据集规模庞大,训练集包含超过24万样本,验证集约6500样本,且图像数据以原始格式保存,保留了丰富的视觉细节。此外,每个样本附带的元数据如许可协议和来源链接,增强了数据的可追溯性与合规性,适用于多样化的研究场景。
使用方法
在应用层面,logasja/FDF数据集主要用于训练和评估人脸关键点检测与姿态估计模型。研究人员可通过HuggingFace平台直接加载数据集,利用其标准化的图像与标注结构,快速集成到深度学习框架中。数据集支持两种配置,用户可根据需求选择默认或FDF配置,分别对应不同的数据子集。典型使用流程包括数据预处理、模型训练与验证,标注的边界框和关键点坐标可直接用于损失计算,推动面部分析技术的实证研究。
背景与挑战
背景概述
在计算机视觉领域,人脸数据处理一直是研究热点,尤其是随着生成对抗网络(GAN)等深度学习技术的兴起,人脸匿名化与隐私保护问题日益凸显。FDF数据集由Håkon Hukkelås、Rudolf Mester和Frank Lindseth等研究人员于2019年构建,其核心研究问题聚焦于通过生成模型实现人脸图像的匿名化处理,以应对隐私泄露风险。该数据集基于《DeepPrivacy: A Generative Adversarial Network for Face Anonymization》论文,旨在推动人脸隐私保护技术的发展,为生成模型在视觉隐私领域的应用提供了重要数据支撑,对计算机视觉与隐私计算的交叉研究产生了深远影响。
当前挑战
FDF数据集所解决的领域问题在于人脸匿名化,其挑战在于如何在保持图像真实感的同时彻底移除可识别特征,避免生成模型产生身份泄露或视觉伪影。构建过程中的挑战包括数据收集的合法性与伦理考量,需确保源图像符合隐私法规;标注环节需精确标定人脸关键点与边界框,以支撑模型训练,但大规模标注易引入噪声与不一致性;此外,数据多样性不足可能限制模型泛化能力,而匿名化效果的评估缺乏统一标准,增加了技术验证的复杂性。
常用场景
经典使用场景
在计算机视觉领域,人脸识别与姿态估计研究常依赖于高质量标注数据。FDF数据集以其丰富的面部关键点标注和边界框信息,为深度学习模型训练提供了坚实基础。该数据集经典应用于面部关键点检测算法的开发与评估,研究者利用其精确的鼻、眼、耳、肩等部位坐标,训练卷积神经网络以提升模型在复杂场景下的定位精度与鲁棒性。
衍生相关工作
围绕FDF数据集,学术界衍生了一系列经典研究工作。例如,基于其标注的DeepPrivacy框架实现了生成对抗网络在面部匿名化中的创新应用;同时,该数据集也促进了多任务学习模型的演进,如联合面部关键点检测与属性分析的端到端系统。这些工作不仅拓展了数据集的利用维度,还为隐私保护视觉计算设立了新的基准。
数据集最近研究
最新研究方向
在计算机视觉领域,人脸匿名化技术正成为隐私保护研究的热点。FDF数据集作为DeepPrivacy框架的基础,其包含的精确人脸关键点标注和边界框信息,为生成对抗网络在面部匿名化任务中的训练提供了关键支撑。当前研究聚焦于利用该数据集提升生成模型的真实性与多样性,以应对日益严格的隐私法规要求,同时确保匿名化后的人脸在视觉上自然且难以识别。这一方向不仅推动了人脸隐私保护技术的进步,也为社交媒体和公共监控场景下的数据安全应用奠定了重要基础。
以上内容由遇见数据集搜集并总结生成



