PerovData
收藏arXiv2025-10-01 更新2025-10-02 收录
下载链接:
https://github.com/wlyyj/PerovSegNet-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
PerovData数据集是由上海师范大学和复旦大学的研究人员创建的,包含10,994张扫描电子显微镜(SEM)图像,用于分析钙钛矿太阳能电池材料。数据集通过多种图像增强技术从40张高质量手动标注的样本扩展而来,旨在帮助研究人员精确识别和量化钙钛矿和碘化铅相,以及缺陷区域。该数据集对于开发自动化的SEM图像分析工具至关重要,有助于优化钙钛矿薄膜的制造过程,提高效率和稳定性。
PerovData dataset was developed by researchers from Shanghai Normal University and Fudan University. It comprises 10,994 scanning electron microscope (SEM) images for the analysis of perovskite solar cell materials. The dataset is expanded from 40 high-quality manually annotated samples through multiple image enhancement techniques, aiming to help researchers accurately identify and quantify perovskite, lead iodide phases, as well as defect regions. This dataset is critical for developing automated SEM image analysis tools, and contributes to optimizing the manufacturing process of perovskite thin films to enhance their efficiency and stability.
提供机构:
上海师范大学,复旦大学
创建时间:
2025-10-01
搜集汇总
数据集介绍

构建方式
在钙钛矿太阳能电池材料表征领域,PerovData数据集的构建采用了系统化的图像采集与标注流程。通过扫描电子显微镜获取40幅高质量原始图像后,研究团队运用旋转、翻转、缩放与色彩调整等数据增强技术,将样本规模扩展至10,994幅。标注过程依托LabelMe工具实现像素级语义分割,生成包含钙钛矿、碘化铅及缺陷区域边界的JSON格式掩码文件,并通过UMAP降维技术验证了不同材料相在特征空间中的可分性。
特点
该数据集的核心价值体现在其多尺度形态学特征的完备性。图像覆盖了从纳米级晶界到微米级晶粒的跨尺度结构,精准标注了钙钛矿相、残留碘化铅及缺陷区域的三元分类体系。统计特征显示实例尺寸呈现连续分布特性,其中小尺度对象占主导地位,空间分布则呈现均衡态势。这种结构特性为深度学习模型提供了识别复杂材料形貌的充分条件,特别有利于提升对低对比度边界与微小缺陷的检测灵敏度。
使用方法
基于该数据集的典型应用遵循端到端的深度学习流程。研究者可借助改进的YOLOv8x架构——PerovSegNet模型,通过自适应混洗膨胀卷积模块增强多尺度特征提取能力,利用可分离自适应下采样模块保持纹理细节。训练阶段采用640×640像素输入尺寸与AdamW优化器,最终模型不仅能输出像素级分割结果,还可自动生成晶粒数量、相面积占比等量化指标,为工艺优化提供数据支撑。
背景与挑战
背景概述
钙钛矿太阳能电池作为第三代光伏技术的代表,自2009年实现3.9%的初始效率以来,其光电转换效率已突破27%,展现出低成本溶液加工与高性能结合的独特优势。微观形貌的精确表征成为提升器件性能的关键,扫描电子显微镜能够以纳米级分辨率揭示薄膜的晶粒尺寸、边界特征及缺陷分布。2025年由上海师范大学与复旦大学联合发布的PerovData数据集,通过深度学习框架PerovSegNet实现了对10,994张SEM图像的自动化分割,为钙钛矿与碘化铅相的定量分析建立了标准化基准。该数据集通过UMAP投影验证了晶体相分离的可靠性,推动了高通量材料表征从人工判读向智能分析的范式转变。
当前挑战
钙钛矿SEM图像分析长期受限于低对比度边界与复杂背景噪声,传统阈值分割方法难以区分模糊的晶界与缺陷区域。PerovData构建过程中面临标注数据稀缺的挑战,原始40张高质量图像需通过旋转、色彩调整等增强技术扩展至万级规模,而手动标注易受主观偏差影响。深度学习模型需克服多尺度形态特征提取的难题,例如YOLOv8基线模型对细小缺陷的识别不足,且计算复杂度限制了实时应用。PerovSegNet通过自适应扩张卷积与可分离下采样模块,在保持87.25%平均精度的同时将计算负载降低25%,但跨分辨率泛化与缺陷类不平衡仍是未来优化的重点方向。
常用场景
经典使用场景
在钙钛矿太阳能电池材料研究中,PerovData数据集通过提供逾万张扫描电子显微镜图像及其精准标注,为深度学习模型训练奠定了坚实基础。该数据集典型应用于自动化微结构分析场景,借助改进的YOLOv8架构实现钙钛矿、碘化铅及缺陷区域的高精度分割,显著提升了材料表征的标准化程度与可重复性。
解决学术问题
该数据集有效解决了传统SEM图像分析依赖人工判读导致的效率低下与主观偏差问题。通过构建大规模标注数据,支撑了自适应分割框架的开发,使研究人员能够量化晶界特征与相分布规律,为揭示结晶动力学与缺陷形成机制提供了数据支撑,推动了材料科学领域从定性描述向定量分析的范式转变。
衍生相关工作
基于该数据集开发的PerovSegNet框架催生了多项创新研究,包括跨尺度微结构关联分析与工艺参数逆向设计。后续研究通过集成时序SEM数据构建动态演化模型,进一步拓展至钙钛矿器件老化机理研究领域,形成了从材料合成到失效分析的全链条智能表征方法体系。
以上内容由遇见数据集搜集并总结生成



