celebA-HQ|人脸识别数据集|机器学习数据集
收藏数据集概述
数据集名称
- celebA-HQ
数据集大小
- 89G
数据集获取步骤
- 下载celebA数据集:使用
download_celebA.py
脚本。 - 解压celebA文件:使用
p7zip
工具。 - 移动
Anno
文件:至celebA
文件夹。 - 下载额外文件:使用
download_celebA_HQ.py
脚本。 - 生成HQ图像:使用
make_HQ_images.py
脚本。
数据集使用方法
-
Docker:推荐使用Docker进行数据集的构建和运行,命令如下:
docker build -t celeba-hq . && docker run -it -v $(pwd):/data celebahq
-
本地运行:需安装特定版本的软件包,并通过
create_celebA-HQ.sh
脚本运行。
预计算数据集
- 提供了一个预计算的数据集,可从Google Drive链接下载,以节省时间和资源。
数据集保存格式
- 最终的HQ图像以
.jpg
格式保存在指定目录下的celeba-hq
文件夹中。
数据集引用
- 推荐引用论文"Progressive Growing of GANs for Improved Quality, Stability, and Variation",该论文由Tero Karras (NVIDIA), Timo Aila (NVIDIA), Samuli Laine (NVIDIA), Jaakko Lehtinen (NVIDIA and Aalto University)提交至ICLR 2018。

中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。
国家海洋科学数据中心 收录
中国近海地形数据集(渤海,黄海,东海,南海)
本数据集包含历年来通过收集和实测方法取得的中国近海水深点数据、地形图数据(ArcGIS格式),以及黄河口、莱州湾东部、辽东湾、山东南部沿海、南海部分海域的单波束、多波束水深测量数据,包括大尺度的低密度水深数据与局部高密度水深数据。
地球大数据科学工程 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
开源PHM数据集
本文分享了一个全球各大学、研究机构和公司捐赠的PHM(Prognostics and Health Management)开源数据集,涵盖加工制造、轨道交通、能源电力和半导体等行业的多种场景,包含部件级、设备级和产线级数据。用户可以利用这些数据开发智能分析和建模算法,数据集分类包括故障诊断、健康评估和寿命预测。
github 收录
Wafer Defect
该数据集包含了七个主要类别的晶圆缺陷,分别是:BLOCK ETCH、COATING BAD、PARTICLE、PIQ PARTICLE、PO CONTAMINATION、SCRATCH和SEZ BURNT。这些类别涵盖了晶圆在生产过程中可能出现的多种缺陷类型,每一种缺陷都有其独特的成因和表现形式。数据集不仅在类别数量上具有多样性,而且在样本的多样性和复杂性上也展现了其广泛的应用潜力。每个类别的样本均经过精心标注,确保了数据的准确性和可靠性。
github 收录