SHG tensors dataset
收藏arXiv2025-04-02 更新2025-04-08 收录
下载链接:
http://arxiv.org/abs/2504.01526v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个由UCLouvain等机构创建的公开可访问的SHG张量数据集,包含约2200个通过密度泛函扰动理论计算得出的静态SHG张量。数据集旨在为非线性光学材料的研究提供帮助,特别是在发现高性能的非线性光学材料方面。数据来源于OPTIMADE联合数据库中的大量结构信息,通过主动学习策略进行筛选和优化,以支持材料的信息学和自动化筛选流程。
This dataset is a publicly accessible SHG tensor dataset created by institutions including UCLouvain, containing approximately 2200 static SHG tensors calculated via density functional perturbation theory. It aims to facilitate research on nonlinear optical materials, particularly in the discovery of high-performance nonlinear optical materials. The data is sourced from a large volume of structural information in the OPTIMADE federated database, and was screened and optimized using active learning strategies to support materials informatics and automated screening workflows.
提供机构:
UCLouvain, Institut de la Matière Condensée et des Nanosciences (IMCN), 比利时鲁汶大学
创建时间:
2025-04-02
搜集汇总
数据集介绍

构建方式
SHG tensors dataset的构建采用了数据驱动的方法,通过OPTIMADE联盟中的数据库筛选候选材料,并利用主动学习策略逐步优化机器学习模型。研究团队采用密度泛函微扰理论(DFPT)计算了约2200个静态SHG张量,确保了数据的高精度和可靠性。整个流程结合了高通量筛选和主动学习,有效提升了数据采集的效率和准确性。
特点
该数据集包含了约2200个计算得到的SHG张量,覆盖了广泛的非线性光学材料。其特点在于通过多保真度校正学习方案提高了数据的准确性,并公开了原始和处理后的张量数据,便于后续研究使用。此外,数据集还包含了材料的能带隙信息,为多目标优化提供了重要参考。
使用方法
SHG tensors dataset可用于高通量筛选和机器学习模型的训练与评估。研究人员可以通过Materials Cloud Archive或OPTIMADE API访问数据,进行非线性光学材料的性能预测和优化。数据集还支持多保真度校正学习,帮助提升低精度数据的预测准确性,为材料发现提供了强有力的工具。
背景与挑战
背景概述
SHG tensors dataset是由Victor Trinquet等人于2025年创建的一个专注于非线性光学(NLO)材料研究的计算数据集。该数据集由比利时鲁汶大学(IMCN)等机构的研究团队开发,旨在解决高效非线性光学晶体设计中的关键问题。数据集包含约2,200个通过密度泛函微扰理论(DFPT)计算的二次谐波产生(SHG)张量,覆盖了从OPTIMADE联盟数据库中筛选的非中心对称无机晶体。该数据集通过主动学习策略构建,显著推动了数据驱动方法在非线性光学材料发现中的应用,为开发具有强二次谐波转换性能的材料提供了重要基础。
当前挑战
该数据集主要解决非线性光学材料设计中两个关键挑战:一是传统实验方法在探索广阔组成空间时存在速度慢、成本高的问题;二是现有开放数据库中普遍缺乏SHG张量数据。在构建过程中面临的主要挑战包括:1)DFPT计算SHG张量需要消耗大量计算资源;2)需要平衡SHG张量与带隙这两个相互制约的物理量;3)机器学习模型在有限初始数据下的预测准确性不足;4)确保数据集中材料在(Eg,dKP)空间中具有代表性分布。此外,数据集还需解决带隙校正等计算精度问题,以及处理不同数据库间的数据标准化问题。
常用场景
经典使用场景
SHG tensors dataset在非线性光学材料研究中扮演着关键角色,其经典应用场景包括通过高通量计算筛选具有强二次谐波生成效应的无机晶体。该数据集通过密度泛函微扰理论计算了约2200个静态SHG张量,为研究人员提供了一个系统评估材料非线性光学性能的平台。在深紫外、中红外等特定电磁波段的新材料探索中,该数据集能够有效指导实验合成方向,避免盲目试错。
衍生相关工作
该数据集已衍生出多项经典研究工作,包括Xie等人基于Materials Project的1500个SHG张量计算,以及Wang团队对2400种材料的筛选研究。其采用的主动学习框架被扩展至折射率预测领域,而提出的多保真度校正学习方法已成为带隙计算的基准方案。数据集还促进了GNoME等新型材料数据库的开发,推动了OPTIMADE联盟在材料数据标准化方面的进展。
数据集最近研究
最新研究方向
近年来,非线性光学(NLO)材料的研究在数据驱动方法的推动下取得了显著进展。SHG tensors dataset作为该领域的重要数据集,通过结合主动学习(active learning)和高通量筛选(high-throughput screening)技术,显著加速了高性能NLO材料的发现。该数据集包含约2200个通过密度泛函微扰理论(DFPT)计算的SHG张量,为材料科学界提供了宝贵的资源。研究重点包括利用机器学习模型预测SHG系数,以及通过多保真度校正学习(multi-fidelity correction-learning)方案提高数据准确性。这些方法不仅优化了材料筛选流程,还为深紫外(DUV)和中红外(mid-IR)等特定电磁范围内的NLO材料设计提供了新思路。数据集的公开访问进一步促进了高通量筛选和材料信息学的发展,标志着NLO材料研究进入了大数据时代。
相关研究论文
- 1Accelerating the discovery of high-performance nonlinear optical materials using active learning and high-throughput screeningUCLouvain, Institut de la Matière Condensée et des Nanosciences (IMCN), 比利时鲁汶大学 · 2025年
以上内容由遇见数据集搜集并总结生成



