five

OPV2D

收藏
github2025-11-25 更新2025-11-26 收录
下载链接:
https://github.com/sunyrain/OPV2D
下载链接
链接失效反馈
官方服务:
资源简介:
OPV2D是一个持续更新的有机光伏供体-受体材料数据集,整合了先前发布的OPV数据集,并通过持续的手动验证和新数据收集进行扩展。该数据集旨在支持机器学习研究、分子生成和大规模OPV筛选。数据集存储在单个实时数据库中:Active_Database.csv,每个条目都标注了是否经过手动验证的checked字段,这种设计使数据集能够有机增长,同时保持透明的数据质量跟踪。

OPV2D is a continuously updated dataset of organic photovoltaic donor-acceptor materials. It integrates previously published OPV datasets and is expanded via ongoing manual validation and new data collection. This dataset aims to support machine learning research, molecular generation, and large-scale OPV screening. The dataset is stored in a single real-time database: Active_Database.csv. Each entry is annotated with a "checked" field indicating whether it has undergone manual validation. This design enables the dataset to grow organically while maintaining transparent data quality tracking.
创建时间:
2025-11-25
原始信息汇总

OPV2D数据集概述

数据集简介

  • 数据集名称:OPV2D(有机光伏给体-受体数据集)
  • 核心内容:有机光伏(OPV)给体-受体(D/A)材料数据集
  • 更新特性:持续更新,包含手动验证和新数据收集
  • 整合范围:集成已发布的OPV数据集并进行扩展

数据存储结构

  • 主数据库:Active_Database.csv
  • 数据标注:每个条目均包含手动验证状态标识字段(checked)

主要应用场景

  • 机器学习:训练预测模型评估OPV性能参数(PCE、HOMO-LUMO能级)和材料分类
  • 生成设计:结合生成模型创建具有优化特性的新型OPV材料
  • 材料发现:加速新型给体-受体对的发现进程

引用规范

主要引用文献

bibtex @misc{qiu2025, title={Accelerating High-Efficiency Organic Photovoltaic Discovery via Pretrained Graph Neural Networks and Generative Reinforcement Learning}, author={Jiangjie Qiu and Hou Hei Lam and Xiuyuan Hu and Wentao Li and Siwei Fu and Fankun Zeng and Hao Zhang and Xiaonan Wang}, year={2025}, eprint={2503.23766}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2503.23766}, }

原始数据源引用

bibtex @article{Min2020, author = {Wu, Yao and Guo, Jie and Sun, Rui and Min, Jie}, title = {Machine learning for accelerating the discovery of high-performance donor/acceptor pairs in non-fullerene organic solar cells}, journal = {npj Computational Materials}, volume = {6}, number = {1}, pages = {120}, year = {2020} }

@article{Saeki2021, author = {Miyake, Yuta and Saeki, Akinori}, title = {Machine Learning-Assisted Development of Organic Solar Cell Materials: Issues, Analyses, and Outlooks}, journal = {The Journal of Physical Chemistry Letters}, volume = {12}, number = {51}, pages = {12391-12401}, year = {2021} }

使用许可

  • 授权方式:MIT许可证
  • 使用范围:学术与研究目的

联系方式

  • 联系邮箱:whilesunny@gmail.com
搜集汇总
数据集介绍
main_image_url
构建方式
在有机光伏材料研究领域,OPV2D数据集的构建体现了系统化整合与动态更新的科学理念。该数据集通过融合多个已发表的有机光伏供体-受体材料数据库,采用持续人工验证机制对原始数据进行质量优化。每个数据条目均标注验证状态字段,形成实时更新的动态数据库架构,既保障了数据的可追溯性,又为材料科学研究提供了持续扩展的基础设施。
特点
作为有机光伏材料领域的重要资源,该数据集展现出多维度特征优势。其采用单一动态数据库存储模式,通过实时更新机制持续纳入新型供体-受体对数据,并配备完整的人工验证标识系统。这种设计不仅确保了数据的时效性与准确性,更通过结构化字段为机器学习任务提供标准化输入,特别适合用于材料性能预测与分子生成等前沿研究方向。
使用方法
针对有机光伏材料开发的实际需求,该数据集支持多元化的应用场景。研究人员可直接调用动态数据库进行机器学习模型训练,用于预测材料的光电转换效率等关键参数;在生成式设计方面,该数据集为深度生成模型提供了丰富的分子结构模板;同时其标准化数据格式也为高通量虚拟筛选提供了可靠支撑,显著加速新型有机光伏材料的发现进程。
背景与挑战
背景概述
有机光伏材料研究作为可再生能源领域的关键分支,致力于开发高效光能转换的给体-受体材料体系。OPV2D数据集由研究团队于2025年创建,整合了既往发布的有机光伏数据集并通过持续人工验证实现动态扩展。该数据集以机器学习驱动材料发现为核心目标,通过系统化收录给体-受体材料的电子结构参数与光伏性能指标,为高通量筛选和生成式设计提供数据基础,显著推进了有机光伏材料的研发效率与理论创新。
当前挑战
在有机光伏材料性能预测领域,传统方法面临分子构效关系复杂性与光电转换机制多尺度耦合的难题。数据集构建过程中需克服三重挑战:其一,原始数据存在异构来源导致的能级对齐偏差与测试条件差异;其二,给体-受体界面相互作用的理论描述需要跨尺度数据融合;其三,动态更新机制要求建立持续的人工验证体系以平衡数据规模与质量矛盾,这对数据标准化流程提出了更高要求。
常用场景
经典使用场景
在有机光伏材料研究领域,OPV2D数据集作为供体-受体材料的集成资源,其经典应用场景聚焦于机器学习模型的训练与验证。研究人员利用该数据集构建预测模型,精准估算关键性能指标如能量转换效率与分子轨道能级,为高通量材料筛选提供可靠基准。通过持续更新的验证机制,数据集确保了模型训练过程的科学严谨性,成为有机光伏材料智能设计的核心基础设施。
解决学术问题
该数据集有效解决了有机光伏研究中供体-受体组合筛选效率低下的核心难题。通过整合多源实验数据并建立标准化表征体系,显著降低了材料开发中的试错成本。在学术层面,它不仅为能级匹配理论提供了实证基础,更通过机器学习方法揭示了分子结构与光电性能的复杂映射关系,推动了材料基因组理念在可再生能源领域的深化应用。
衍生相关工作
基于该数据集衍生的经典研究呈现出多学科交叉特征。在计算方法层面,结合图神经网络的预训练模型实现了分子表征的跨任务迁移;在生成式设计领域,强化学习框架与数据集协同催生了具有自主知识产权的新型供体分子。这些突破性工作不仅发表于《npj Computational Materials》等顶级期刊,更形成了从数据驱动到智能创造的完整研究范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作