Anime Face Dataset|动漫脸谱生成数据集|图像识别数据集
收藏Anime Face Dataset 概述
数据集描述
- 生成工具:该数据集是通过一个工具包生成的,默认设置下可生成超过8000张动漫脸图像样本。
- 图像来源:图像主要从Getchu收集,筛选自2013年以后发布的游戏CG。
- 图像处理:使用Libcascade Animeface进行面部检测和裁剪,并通过Wifu2x将图像放大至128x128像素。
- 注意事项:不建议对图像进行超过两次的放大处理,以避免引入噪声和模糊轮廓。
数据集用途
- 生成高质量动漫脸图像:用于训练Generative Adversarial Network (GAN)模型,以生成稳定的、高质量的动漫脸图像。
数据集构建指南
- 获取游戏信息:通过SQL查询从Erogame Space获取游戏列表。
- 图像采集:使用基于Scrapy的爬虫从Getchu网站抓取游戏图像。
- 面部检测与裁剪:应用Libcascade Animeface算法检测并裁剪出动漫脸图像。
- 图像放大:使用Wifu2x将裁剪后的图像放大至128x128像素。
数据集限制
- 分辨率限制:本项目不提供超过128x128像素的高分辨率动漫脸图像。
- 多次放大警告:过度放大可能导致图像质量下降,影响GAN模型的训练效果。
数据集版本
- 编辑版本:该数据集是基于Jin, Y.的工作的编辑版本。

Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
EcoInvent
EcoInvent是一个生命周期评估(LCA)数据库,包含了大量产品的环境影响数据。它提供了详细的产品生命周期数据,包括原材料提取、生产、使用和废弃处理等各个阶段的环境影响信息。
www.ecoinvent.org 收录
SeaDronesSee
SeaDronesSee是由德国图宾根大学认知系统组创建的大型视觉对象检测和跟踪基准,专注于海洋环境中的人类检测。该数据集包含超过54,000帧,总计400,000个实例,从不同高度和视角(5至260米,0至90度)捕获,并提供详细的元信息。数据集的创建旨在填补陆基视觉系统与海基系统之间的差距,特别适用于无人机辅助的海上搜救任务。SeaDronesSee通过提供精确的元数据,如高度、视角和速度,支持多模态系统的开发,以提高检测的准确性和速度。此外,数据集还包括多光谱图像,利用非可见光谱(如近红外和红边光谱)来增强人类检测能力。
arXiv 收录