five

Age Estimation Face Dataset: Minors & Young Adults (10-30 Years)

收藏
github2026-04-08 更新2026-04-25 收录
下载链接:
https://github.com/axonlab-data/age-estimation-minors-face-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
年龄估计人脸数据集:包含10,000多张经过同意的未成年人和年轻人(10-30岁)的自拍照片,带有经过验证的每岁年龄标签。多民族,手机拍摄。专为18岁以下年龄门控、年龄验证和人脸识别而构建。

Age Estimation Face Dataset: Contains over 10,000 consented self-portrait photographs of minors and young adults aged 10–30, with verified per-year age labels. The dataset has a multi-ethnic demographic, with all images captured via mobile phones. It is specifically developed for age gating for individuals under 18, age verification and face recognition applications.
创建时间:
2026-04-03
原始信息汇总

根据您提供的数据集详情页面README文件,以下是该数据集的详细信息总结:

数据集名称

Age Estimation Face Dataset: Minors & Young Adults (10-30 Years)

数据集概述

属性 描述
总图片数 超过10,000张
年龄范围 10-30岁(按年分文件夹)
种族构成 黑人、白人、西班牙裔
性别构成 男、女
采集设备 智能手机前置摄像头
标注内容 年龄、性别、种族
数据格式 JPEG图片 + CSV元数据文件
法律授权 完全法律同意(含监护人同意)

元数据格式

列名 描述 示例
file_name 图片文件名 age_14_0023.jpeg
age_folder 年龄文件夹 age_14
age 采集时确认的年龄 14
gender 性别 female
ethnicity 种族 black

主要应用场景

1. 年龄门控与法律合规

  • 输入:应用注册阶段的用户自拍
  • 模型:基于该数据集训练的年龄估计模型
  • 输出:under_18 / over_18
  • 动作:允许或阻止访问
  • 特点:在18岁边界附近有密集的按年采样,减少误判

2. 年龄估计

  • 在10-30岁年龄段微调预训练模型(如DEX、MiVOLO、AgeNet)
  • 降低该年龄段平均绝对误差(MAE)
  • 使用经过出生年份验证的标签作为真实数据

3. 无需身份证的年龄验证

  • 仅通过手机自拍进行年龄检查
  • 无需上传证件,实现无摩擦的用户注册

4. 偏差评估

  • 利用结构化的元数据,跨种族和性别测试现有年龄估计模型
  • 在上线前发现并修复人口统计学层面的精度差距

与公开数据集的对比

特征 本数据集 UTKFace IMDB-WIKI MORPH FG-NET
年龄范围 10-30 0-116 0-100 16-77 0-69
青少年聚焦程度 密集 稀疏 稀疏 稀疏
标签质量 出生年份验证 从文件名解析 噪声大/爬取 已验证 已验证
种族多样性 3个群体,平衡 5个群体 偏斜 80%单一群体 有限
授权情况 完整+监护人 仅研究 仅研究
商业许可
自拍专用 混合 网页照片 入狱照风格 混合

获取完整数据集

该仓库仅提供描述信息。要获取包含商业许可的10,000+图片完整数据集:

  1. 浏览样本:可访问 KaggleHuggingFace
  2. 申请访问:访问 axonlab.ai
  3. 联系团队:发送邮件至 sales@axonlabs.pro

注意事项

  • 该仓库仅包含数据集描述,不包含实际图片数据
  • 所有图片均获得完整的法律许可(包含监护人同意)
  • 数据集提供商业许可授权
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过严格的法律授权流程构建,收集了超过10,000张由智能手机前置摄像头拍摄的自拍照,涵盖10至30岁年龄段的青少年及年轻成年人。每张图像均配有经过出生年份验证的年龄标签,并以按年龄分组的文件夹形式组织。数据集还包含性别与种族(黑人、白种人、西班牙裔)的多维元数据,所有元数据以CSV文件的形式与JPEG图像一同存储,确保了数据结构的清晰与易用性。
特点
数据集的突出优势在于其密集覆盖了10至30岁年龄段,尤其是在18岁边界附近提供了丰富样本,这大幅提升了未成年人年龄验证模型的精度与可靠性。相比UTKFace、IMDB-WIKI等公开数据集,该数据集不仅拥有经过验证的高质量标签,还实现了种族与性别的相对均衡分布。此外,所有图像均获得本人及监护人的知情同意,并附带商业使用许可,这在年龄估计领域极为稀缺。
使用方法
用户可通过Kaggle或HuggingFace平台浏览样本并申请访问完整数据集。在日常应用中,该数据集适用于训练年龄估计回归模型或基于18岁阈值的二分类器,以服务于未成年人年龄闸门、无证件年龄验证等场景。同时,利用结构化元数据,研究者可对模型进行跨种族与性别的偏差评估,从而优化不同人群上的预测表现。完整数据集的获取需通过官方渠道提交请求。
背景与挑战
背景概述
年龄估计在人脸识别与数字身份验证领域占据着举足轻重的地位,尤其在未成年人保护与合规性审查场景中,精准判别用户是否年满18岁已成为各国监管框架下的核心需求。该数据集由AxonData团队于近期创建,聚焦10至30岁年龄段的未成年人及年轻成人群体,包含超过一万张经监护人及本人完全知情同意的智能手机自拍图像。数据涵盖黑、白、拉丁三种族裔,男女分布均衡,且每张图像均附带经过验证的真实年龄标签,解决了现有公用数据集在青少年年龄段采样稀疏、标签噪声高、缺乏商业许可等关键缺陷。该数据集的发布为开发低错误率的未成年人年龄门控系统、提升年轻年龄段年龄估计精度以及公平性评估提供了高质量的基准资源。
当前挑战
该数据集所面临的挑战首先体现在领域问题层面:10至30岁年龄段恰逢人面部特征因青春期发育而剧烈变化,年龄估计模型需在极窄的年龄跨度内实现高精度判别,尤其是18岁边界线附近,轻微预测偏差即可导致严重的合规风险。构建过程中则面临多重困难:收集真实年龄标签需逐一核验出生日期,排除匿名化带来的数据污染;获取未成年人及监护人双重同意显著提升了数据采集门槛;跨手机前端摄像头的图像在光照、分辨率、角度等方面高度异质,增加了标注一致性与模型泛化的难度。此外,在仅有三个族裔的前提下,如何确保模型避免对少数群体的系统性偏差也是持续挑战。
常用场景
经典使用场景
在青少年年龄估算与合规审查领域,该数据集为构建面向未成年人的年龄门控(Age Gating)模型提供了理想训练资源。凭借每岁标注的10至30岁自拍影像,研究者可针对性地训练回归或二分类模型,精准区分用户是否年满18岁,尤其围绕18岁边界附近的密集采样显著降低了假阳性与假阴性率,成为社交平台、数字娱乐等场景下年龄验证的重要基准。
实际应用
在实际部署中,该数据集赋能了无证件年龄验证系统,使平台仅通过用户手机自拍即可实现无摩擦的注册审核,避免了繁琐的文档上传流程。电商、社交媒体及数字内容服务商可借此构建合规的年龄门控机制,自动拦截未满18岁用户访问受限内容,同时满足GDPR及儿童在线隐私保护法(COPPA)等法规要求,在保障青少年权益的同时提升用户体验与运营效率。
衍生相关工作
基于该数据集,学界与工业界已衍生出一系列经典工作,包括在DEX、MiVOLO、AgeNet等预训练模型上进行微调以提升10-30岁区间的估计精度,以及开发面向边缘部署的轻量级年龄分类网络。此外,围绕该数据集的多元标签结构,研究人员构建了人口学偏差评估基准,促进了公平感知损失函数的提出与验证,相关成果已被引用至多篇年龄估计综述与未成年人保护技术白皮书。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作