CelebA|人脸识别数据集|属性分析数据集
收藏数据集概述
- 数据集名称: CelebA (CelebFaces Attributes Dataset)
- 数据集用途: 用于训练微笑分类器,分析合成图像中的微笑面部属性。
- 数据集规模:
- 10,177个身份
- 202,599张面部图像
- 每张图像包含5个地标位置和40个二进制属性注释
- 数据集特点:
- 包含大量名人图像,具有显著的姿态和范围变化
- 提供丰富的属性细节,适用于面部属性分析
数据集使用
- 模型训练: 使用ResNet50网络,针对微笑属性进行二分类训练,采用二元交叉熵损失、Adam优化器(学习率0.01)和Early Stopping作为正则化方法。
- 图像预处理: 将原始1024×1024分辨率的图像调整为224×224分辨率,以适应模型输入要求。
- 数据划分: 自动将数据分为训练、验证和测试集,使用Keras的“Flow from Dataframe”方法处理数据。
运行环境
- 软件要求:
- Python 3.7
- TensorFlow 2.2.0
- Keras 2.4.3
- Pillow
- MatPlotLib
运行步骤
- 下载CelebA数据集,将图像放置在
./celeba/*.jpg
,属性注释放置在./list_attr_celeba.txt
。 - 下载并运行
ResNet50.py
脚本。

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国高分辨率高质量PM2.5数据集(2000-2023)
ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。
国家青藏高原科学数据中心 收录