five

logasja/FDF

收藏
Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/logasja/FDF
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: default features: - name: image dtype: image - name: landmarks struct: - name: nose struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: bbox struct: - name: x_min dtype: uint16 - name: y_min dtype: uint16 - name: x_max dtype: uint16 - name: y_max dtype: uint16 - name: metadata struct: - name: license dtype: string - name: photo_url dtype: string splits: - name: train num_bytes: 24947710877.238 num_examples: 241982 - name: validation num_bytes: 675281167.698 num_examples: 6531 download_size: 25546589444 dataset_size: 25622992044.935997 - config_name: fdf features: - name: image dtype: image - name: landmarks struct: - name: nose struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_eye struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_ear struct: - name: x dtype: float32 - name: y dtype: float32 - name: r_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: l_shoulder struct: - name: x dtype: float32 - name: y dtype: float32 - name: bbox struct: - name: x_min dtype: uint16 - name: y_min dtype: uint16 - name: x_max dtype: uint16 - name: y_max dtype: uint16 - name: metadata struct: - name: license dtype: string - name: photo_url dtype: string splits: - name: train num_bytes: 39416677329.737 num_examples: 1421253 - name: validation num_bytes: 1394389688.0 num_examples: 50000 download_size: 40895711741 dataset_size: 40811067017.737 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - config_name: fdf data_files: - split: train path: fdf/train-* - split: validation path: fdf/validation-* ---

数据集信息: ### 配置1:default(默认配置) #### 特征字段: 1. `image`:数据类型为图像 2. `landmarks`(人脸关键点):嵌套结构体,包含以下子字段: - `nose`(鼻子):嵌套结构体,含`x`(x坐标)、`y`(y坐标),数据类型均为float32 - `r_eye`(右眼):嵌套结构体,含`x`、`y`坐标,数据类型均为float32 - `l_eye`(左眼):嵌套结构体,含`x`、`y`坐标,数据类型均为float32 - `r_ear`(右耳):嵌套结构体,含`x`、`y`坐标,数据类型均为float32 - `l_ear`(左耳):嵌套结构体,含`x`、`y`坐标,数据类型均为float32 - `r_shoulder`(右肩):嵌套结构体,含`x`、`y`坐标,数据类型均为float32 - `l_shoulder`(左肩):嵌套结构体,含`x`、`y`坐标,数据类型均为float32 3. `bbox`(边界框,bounding box):嵌套结构体,包含以下子字段: - `x_min`(最小x坐标):数据类型为uint16 - `y_min`(最小y坐标):数据类型为uint16 - `x_max`(最大x坐标):数据类型为uint16 - `y_max`(最大y坐标):数据类型为uint16 4. `metadata`(元数据):嵌套结构体,包含以下子字段: - `license`(许可证):数据类型为字符串 - `photo_url`(图片链接):数据类型为字符串 #### 数据集划分: - 训练集(train):字节占用量为24947710877.238,样本总数为241982 - 验证集(validation):字节占用量为675281167.698,样本总数为6531 #### 整体参数: 下载总大小为25546589444,数据集总存储大小为25622992044.935997 ### 配置2:fdf #### 特征字段与默认配置完全一致: 1. `image`:数据类型为图像 2. `landmarks`(人脸关键点):嵌套结构体,覆盖鼻子、右眼、左眼、右耳、左耳、右肩、左肩的x、y坐标,数据类型均为float32 3. `bbox`(边界框,bounding box):嵌套结构体,包含`x_min`、`y_min`、`x_max`、`y_max`,数据类型均为uint16 4. `metadata`(元数据):嵌套结构体,包含`license`(许可证)与`photo_url`(图片链接),数据类型均为字符串 #### 数据集划分: - 训练集(train):字节占用量为39416677329.737,样本总数为1421253 - 验证集(validation):字节占用量为1394389688.0,样本总数为50000 #### 整体参数: 下载总大小为40895711741,数据集总存储大小为40811067017.737 ### 配置项: 1. 配置名称:default,数据文件路径: - 训练集:`data/train-*` - 验证集:`data/validation-*` 2. 配置名称:fdf,数据文件路径: - 训练集:`fdf/train-*` - 验证集:`fdf/validation-*`
提供机构:
logasja
原始信息汇总

数据集概述

配置 default

  • 特征:
    • image: 图像数据类型
    • landmarks: 结构化特征,包括以下子特征:
      • nose: 包含 xy 坐标,数据类型为 float32
      • r_eye: 包含 xy 坐标,数据类型为 float32
      • l_eye: 包含 xy 坐标,数据类型为 float32
      • r_ear: 包含 xy 坐标,数据类型为 float32
      • l_ear: 包含 xy 坐标,数据类型为 float32
      • r_shoulder: 包含 xy 坐标,数据类型为 float32
      • l_shoulder: 包含 xy 坐标,数据类型为 float32
    • bbox: 包含边界框坐标,数据类型为 uint16
    • metadata: 包含 licensephoto_url,数据类型为 string
  • 分割:
    • train: 241982 个样本,占用 24947710877.238 字节
    • validation: 6531 个样本,占用 675281167.698 字节
  • 下载大小: 25546589444 字节
  • 数据集大小: 25622992044.935997 字节

配置 fdf

  • 特征:
    • image: 图像数据类型
    • landmarks: 结构化特征,包括以下子特征:
      • nose: 包含 xy 坐标,数据类型为 float32
      • r_eye: 包含 xy 坐标,数据类型为 float32
      • l_eye: 包含 xy 坐标,数据类型为 float32
      • r_ear: 包含 xy 坐标,数据类型为 float32
      • l_ear: 包含 xy 坐标,数据类型为 float32
      • r_shoulder: 包含 xy 坐标,数据类型为 float32
      • l_shoulder: 包含 xy 坐标,数据类型为 float32
    • bbox: 包含边界框坐标,数据类型为 uint16
    • metadata: 包含 licensephoto_url,数据类型为 string
  • 分割:
    • train: 1421253 个样本,占用 39416677329.737 字节
    • validation: 50000 个样本,占用 1394389688.0 字节
  • 下载大小: 40895711741 字节
  • 数据集大小: 40811067017.737 字节
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,人脸数据集对于推动面部识别与姿态估计技术的发展至关重要。logasja/FDF数据集的构建依托于大规模图像采集与精细标注流程,其数据来源于公开图像资源,通过自动化与人工协同的方式,对每幅图像中的人脸关键点进行标注,涵盖鼻部、双眼、双耳及双肩等七个关键部位坐标,同时提供边界框信息。数据经过清洗与验证,划分为训练集与验证集,确保标注的一致性与准确性,为模型训练提供了结构化且可靠的数据基础。
特点
该数据集在面部分析研究中展现出显著特点,其核心在于提供了高精度的人脸关键点标注,每个样本均包含七个关键点的二维坐标,这些坐标以浮点数形式存储,支持细粒度的人脸姿态分析。数据集规模庞大,训练集包含超过24万样本,验证集约6500样本,且图像数据以原始格式保存,保留了丰富的视觉细节。此外,每个样本附带的元数据如许可协议和来源链接,增强了数据的可追溯性与合规性,适用于多样化的研究场景。
使用方法
在应用层面,logasja/FDF数据集主要用于训练和评估人脸关键点检测与姿态估计模型。研究人员可通过HuggingFace平台直接加载数据集,利用其标准化的图像与标注结构,快速集成到深度学习框架中。数据集支持两种配置,用户可根据需求选择默认或FDF配置,分别对应不同的数据子集。典型使用流程包括数据预处理、模型训练与验证,标注的边界框和关键点坐标可直接用于损失计算,推动面部分析技术的实证研究。
背景与挑战
背景概述
在计算机视觉领域,人脸数据处理一直是研究热点,尤其是随着生成对抗网络(GAN)等深度学习技术的兴起,人脸匿名化与隐私保护问题日益凸显。FDF数据集由Håkon Hukkelås、Rudolf Mester和Frank Lindseth等研究人员于2019年构建,其核心研究问题聚焦于通过生成模型实现人脸图像的匿名化处理,以应对隐私泄露风险。该数据集基于《DeepPrivacy: A Generative Adversarial Network for Face Anonymization》论文,旨在推动人脸隐私保护技术的发展,为生成模型在视觉隐私领域的应用提供了重要数据支撑,对计算机视觉与隐私计算的交叉研究产生了深远影响。
当前挑战
FDF数据集所解决的领域问题在于人脸匿名化,其挑战在于如何在保持图像真实感的同时彻底移除可识别特征,避免生成模型产生身份泄露或视觉伪影。构建过程中的挑战包括数据收集的合法性与伦理考量,需确保源图像符合隐私法规;标注环节需精确标定人脸关键点与边界框,以支撑模型训练,但大规模标注易引入噪声与不一致性;此外,数据多样性不足可能限制模型泛化能力,而匿名化效果的评估缺乏统一标准,增加了技术验证的复杂性。
常用场景
经典使用场景
在计算机视觉领域,人脸识别与姿态估计研究常依赖于高质量标注数据。FDF数据集以其丰富的面部关键点标注和边界框信息,为深度学习模型训练提供了坚实基础。该数据集经典应用于面部关键点检测算法的开发与评估,研究者利用其精确的鼻、眼、耳、肩等部位坐标,训练卷积神经网络以提升模型在复杂场景下的定位精度与鲁棒性。
衍生相关工作
围绕FDF数据集,学术界衍生了一系列经典研究工作。例如,基于其标注的DeepPrivacy框架实现了生成对抗网络在面部匿名化中的创新应用;同时,该数据集也促进了多任务学习模型的演进,如联合面部关键点检测与属性分析的端到端系统。这些工作不仅拓展了数据集的利用维度,还为隐私保护视觉计算设立了新的基准。
数据集最近研究
最新研究方向
在计算机视觉领域,人脸匿名化技术正成为隐私保护研究的热点。FDF数据集作为DeepPrivacy框架的基础,其包含的精确人脸关键点标注和边界框信息,为生成对抗网络在面部匿名化任务中的训练提供了关键支撑。当前研究聚焦于利用该数据集提升生成模型的真实性与多样性,以应对日益严格的隐私法规要求,同时确保匿名化后的人脸在视觉上自然且难以识别。这一方向不仅推动了人脸隐私保护技术的进步,也为社交媒体和公共监控场景下的数据安全应用奠定了重要基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作