CelebA-HQ|图像生成数据集|人工智能数据集
收藏mk_CelebA-HQ_dataset
概述
- 数据集名称: mk_CelebA-HQ_dataset
- 数据集用途: 用于生成 CelebA-HQ 数据集。
- 数据集来源: 基于 celeba-hq-modified 进行了略微修改。
- 数据集描述: CelebA-HQ 数据集是在 ICLR2018 由 NVIDIA 在 《Progressive Growing of GANs for Improved Quality, Stability, and Variation》 中提出,其中包含30k张1024分辨率图像。
使用方法
环境要求
- Python版本: 3.6
- 操作系统: Ubuntu 22.04.4 LTS
- 内核版本: 6.8.0-47-generic
步骤
-
克隆仓库: bash git clone https://github.com/willylulu/celeb-hq-modified
-
创建环境: bash conda create -n mk_dataset python=3.6
-
配置环境: bash pip install -r requirements.txt
-
解决噪点问题: bash conda search -c conda-forge jpeg conda install -c conda-forge jpeg=8d
-
准备必需文件:
celeba_dir ├── img_celeba ├── 000001.jpg ├── 000002.jpg ... ├── Anno └── list_landmarks_celeba.txt
delta_dir ├── image_list.txt ├── deltas00000.zip ├── deltas01000.zip ... └── deltas29000.zip
-
修改参数: python p.add_argument(-create_what, help=what dataset, default=celebahq) p.add_argument(-h5_filename, help=HDF5 file to create, default=123456.h5) p.add_argument(-celeba_dir, help=Directory to read CelebA data from, default=/a/b/e) p.add_argument(-delta_dir, help=Directory to read CelebA-HQ deltas from, default=/a/b/d)
-
执行脚本: bash python <path_of_h5tool.py>
-
直接运行: bash cd <dir_of_h5tool.py> python h5tool.py --celeba_dir <path_to_celeba> --delta_dir <path_to_delta>
参考

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
Global Volcano Database
全球火山数据库包含有关全球火山的信息,包括火山的位置、类型、历史喷发记录、海拔高度等详细数据。该数据集旨在为地质学家、环境科学家和应急管理机构提供有关火山活动的全面信息。
volcano.si.edu 收录
中国知识产权局专利数据库
该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。
www.cnipa.gov.cn 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录