five

OSBAD

收藏
arXiv2025-11-04 更新2025-11-19 收录
下载链接:
https://github.com/meichinpang/osbad/tree/master/database
下载链接
链接失效反馈
官方服务:
资源简介:
OSBAD是一个开放源代码的异常检测基准,用于电池应用中的异常检测框架。它包含15种不同的算法,包括统计、基于距离和无监督机器学习方法。通过在具有不同电极材料和电解质组成的两个独立数据集上评估OSBAD,展示了其跨化学泛化能力,以识别不同电化学系统中的不规则性。通过提供具有开源、可重复的异常检测工作流程的基准测试数据库,OSBAD为开发安全的、可扩展的和可迁移的异常检测工具建立了统一的框架。

OSBAD is an open-source anomaly detection benchmark designed for anomaly detection frameworks in battery applications. It includes 15 distinct algorithms, covering statistical, distance-based, and unsupervised machine learning methods. Its cross-chemical generalization capability for identifying irregularities across diverse electrochemical systems was demonstrated by evaluating OSBAD on two independent datasets with varying electrode materials and electrolyte compositions. By providing a benchmark database paired with an open-source and reproducible anomaly detection workflow, OSBAD establishes a unified framework for developing safe, scalable, and transferable anomaly detection tools.
提供机构:
BASF SE, Ludwigshafen am Rhein, Germany; Institute of Multidisciplinary Research for Advanced Materials, Tohoku University
创建时间:
2025-11-04
搜集汇总
数据集介绍
main_image_url
构建方式
在电池安全监测领域,OSBAD数据集的构建融合了多源异构电池循环数据,涵盖液态电解质与固态电池体系。通过整合15种统计、距离度量及无监督机器学习算法,该数据集采用基于物理与统计特征转换的工作流程,将集体异常分解为点异常以增强可分离性。构建过程中运用贝叶斯优化管道实现超参数自动调优,并通过迁移学习与回归代理方法解决无标签数据的瓶颈问题,确保了跨电化学体系的可泛化性。
使用方法
该数据集的使用需通过特征工程预处理,将原始电压-容量数据转换为基于中位数与四分位距的缩放特征。用户可调用集成算法库进行异常检测,其中贝叶斯超参数优化支持基于迁移学习或回归代理的两种调优模式。评估阶段需采用马修斯相关系数等鲁棒性指标,避免类别不平衡导致的评估偏差。数据与代码通过开源数据库DuckDB及GitHub平台发布,支持端到端可复现工作流。
背景与挑战
背景概述
随着电池技术在消费电子、电动汽车及短程电动航空等领域的广泛应用,电池安全监控成为保障系统可靠运行的核心议题。OSBAD数据集由BASF SE与日本东北大学联合团队于2025年提出,旨在构建电化学应用中异常检测的开源基准框架。该数据集聚焦于锂离子电池充放电循环过程中的电压与容量异常模式,通过整合15种涵盖统计方法、距离度量及无监督机器学习的算法,建立了跨电化学体系的标准化评估体系。其创新性在于引入物理信息驱动的特征变换流程与贝叶斯超参数优化机制,显著提升了异常分离能力与跨化学体系泛化性能,为高可靠性能源系统的数据驱动诊断奠定了统一基础。
当前挑战
在电池异常检测领域,核心挑战在于如何从高维度、非线性且存在标签缺失的充放电数据中精准识别潜在安全风险。具体表现为:其一,异常模式具有多态性,包括点异常、集体异常及局部异常,且常与正常数据分布高度重叠;其二,无监督场景下超参数调优依赖人工先验,而传统评估指标在类别不平衡数据中易产生偏差;其三,数据构建过程中需克服跨电化学体系(如液态与固态电池)的异构性,同时需通过物理统计特征变换将集体异常解构为可检测的点异常,以应对测量误差与设备故障导致的复杂异常模式。
常用场景
经典使用场景
在电化学储能系统安全监测领域,OSBAD数据集通过整合15种统计与机器学习异常检测算法,为电池循环数据中的电压/容量异常模式识别提供了标准化评估框架。该数据集典型应用于充放电曲线异常检测场景,研究人员可利用其多算法比对功能,在锂离子电池循环数据中精准识别由设备故障或制造缺陷引发的电压突变、容量跳变等异常模式,为电池健康状态评估建立可靠基准。
解决学术问题
OSBAD有效解决了电池数据分析中无监督异常检测的三大核心难题:针对标记数据稀缺的困境,提出基于贝叶斯优化的超参数自动调优流程;通过物理信息特征转换技术,将集体异常分解为可检测的点异常;突破电化学体系差异限制,在液态/固态电解质电池数据上验证了跨化学泛化能力。这些突破为高维电池数据中隐含故障模式的挖掘提供了理论支撑,推动了安全关键能源系统的可信诊断范式发展。
实际应用
该数据集在电动汽车电池管理系统、消费电子设备安全监控等场景展现显著价值。工程人员可借助其开源工作流,在电池组实时监测中快速识别过充/过放异常,预防热失控风险。例如在动力电池全生命周期管理中,通过集成OSBAD的隔离森林算法,能在数千次循环数据中自动标记电压越界周期,相较传统人工检测效率提升三个数量级,为电池安全运维提供标准化技术路径。
数据集最近研究
最新研究方向
在电化学储能系统安全监测领域,OSBAD数据集正推动异常检测技术向多算法融合与跨化学体系泛化方向演进。该框架通过集成统计方法、距离度量及无监督机器学习等15种算法,构建了系统性的评估基准,显著提升了液态与固态电池异常模式的识别能力。当前研究聚焦于物理信息特征工程与贝叶斯超参数优化的协同创新,通过统计特征变换将集体异常分解为点异常,有效增强了异常分离度。针对无监督学习中标签缺失的瓶颈问题,提出的迁移学习与回归代理双路径优化策略,为高维电化学数据的自动化诊断提供了新范式,其跨电解质体系的泛化能力正加速数据驱动方法在安全关键能源系统中的标准化应用。
相关研究论文
  • 1
    通过BASF SE, Ludwigshafen am Rhein, Germany; Institute of Multidisciplinary Research for Advanced Materials, Tohoku University · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作