PulseBat
收藏github2024-06-27 更新2024-07-24 收录
下载链接:
https://github.com/terencetaothucb/CVAE-Rapid-SOH-Estimation-for-Retired-Batteries-Using-Generated-Data
下载链接
链接失效反馈官方服务:
资源简介:
PulseBat数据集包含2700个退役锂离子电池样本,涵盖3种正极材料类型、3种物理格式、4种容量设计和4种历史使用情况。该数据集用于支持快速、准确和可持续的下游SOH(健康状态)估计任务。
The PulseBat dataset comprises 2700 retired lithium-ion battery samples, covering three types of cathode materials, three physical formats, four capacity designs, and four historical usage scenarios. It is intended to support fast, accurate and sustainable downstream State of Health (SOH) estimation tasks.
创建时间:
2024-06-27
原始信息汇总
数据集概述
数据集描述
该数据集包含2700个退役锂离子电池样本,涵盖3种正极材料类型、3种物理格式、4种容量设计和4种历史使用情况。这些数据用于支持快速且准确的退役电池健康状态(SOH)预处理估计,通过生成式机器学习策略,实现了在未见过的退役条件下,使用简单的回归器实现低于6%的平均绝对百分比误差。
数据集组成
- 电池类型:
- 正极材料:NMC、LMO、LFP
- 标称容量:2.1 Ah、10 Ah、21 Ah、35 Ah
- 物理格式:圆柱形、袋状、方形铝壳
- 历史使用:实验室加速老化、HEV1、BEV1、HEV2
- 数量:67(来自12个物理电池)、95、52、56
实验设置
- 环境:Python(Jupyter notebook)
- Python依赖:
- python=3.11.5
- numpy=1.26.4
- tensorflow=2.15.0
- keras=2.15.0
- matplotlib=3.9.0
- scipy=1.13.1
- scikit-learn=1.3.1
- pandas=2.2.2
实验步骤
-
设计并训练条件变分自编码器(CVAE)模型:
- 使用注意力机制的VAE模型,处理和压缩输入数据到潜在空间。
- 条件输入(SOC + SOH)通过嵌入层转换为64维的潜在空间。
- 主输入(21维特征)也转换为64维潜在空间。
- 通过交叉注意力机制,网络聚焦于电压响应矩阵和退役条件信息。
-
潜在空间缩放和采样以生成数据:
- 根据先验知识对潜在空间进行缩放,以覆盖实际退役条件。
- 在缩放的潜在空间中进行采样,生成新数据。
-
使用生成数据进行下游任务:
- 使用生成数据训练随机森林模型,预测电池SOH。
实验细节
-
VAE模型:
- 编码器和解码器均引入注意力机制,处理条件输入和主输入。
- 编码器将输入压缩到潜在空间,解码器从潜在空间重建数据。
-
潜在空间缩放和采样:
- 根据插值和外推设置,使用不同的潜在空间缩放策略。
- 采样步骤允许模型捕捉输入数据的隐藏结构,生成新数据。
-
随机森林回归器:
- 使用生成数据训练随机森林模型,预测SOH。
- 随机森林回归器的超参数设置为K=20,最小叶大小=1,最大深度=64。
数据访问
- 原始数据和处理后的特征可在此处获取,遵循MIT许可证。
致谢
- 模型和算法设计、实验开发和测试、模型和实验代码上传、实验计划修订以及文档编写由Terence (Shengyu) Tao和Zixi Zhao完成。
搜集汇总
数据集介绍

构建方式
PulseBat数据集的构建基于对270个退役锂离子电池的物理测试,涵盖了三种正极材料、四种历史使用情况、三种物理格式和四种容量设计。通过生成性机器学习策略,利用已测量的数据生成新的数据,以应对未见过的退役条件。具体而言,数据集通过条件变分自编码器(CVAE)模型进行生成,该模型结合了交叉注意力机制,能够根据退役条件信息生成新的电压响应数据。
特点
PulseBat数据集的显著特点在于其广泛涵盖了多种退役电池的特性,包括不同的正极材料、物理格式、容量设计和历史使用情况。此外,数据集通过生成性机器学习方法,能够生成在未见过的退役条件下的数据,从而提高了数据驱动方法在SOH估计中的鲁棒性。生成的数据具有高度的真实性和多样性,能够有效提升模型的泛化能力。
使用方法
使用PulseBat数据集时,首先需配置Python环境,确保安装了所需的Python库。接着,用户可以通过调整超参数文件中的设置,选择电池类型、模型大小和测试条件。运行主脚本`main.py`后,数据生成和SOH估计实验将自动执行。生成的数据可用于训练随机森林回归模型,以预测电池的健康状态(SOH)。最终,用户可以通过访问提供的链接获取原始数据和处理后的特征,进行进一步的分析和应用。
背景与挑战
背景概述
PulseBat数据集由Tsinghua Berkeley Shenzhen Institute的研究团队创建,旨在解决退役锂离子电池健康状态(SOH)快速且准确的预处理估算问题。该数据集包含了2700个退役锂离子电池样本,涵盖了三种正极材料、三种物理格式、四种容量设计和四种历史使用情况。通过生成式机器学习策略,该数据集能够有效缓解数据驱动方法在SOH估算中对退役条件敏感的问题,为可持续电池回收提供了关键技术支持。
当前挑战
PulseBat数据集面临的挑战主要包括数据收集的复杂性和对退役条件的敏感性。首先,构建过程中需要对大量退役电池进行物理测试,涵盖多种正极材料和使用历史,这增加了数据收集的难度。其次,数据驱动方法对退役条件的敏感性可能导致估算性能下降,尤其是在面对未见过的退役条件时。此外,生成式机器学习模型的设计和训练也面临技术挑战,如如何有效地在潜在空间中进行缩放和采样,以生成符合实际退役条件的数据。
常用场景
经典使用场景
PulseBat数据集在电池健康状态(SOH)估计中展现了其经典应用场景。通过收集和分析2700个退役锂离子电池样本,涵盖三种正极材料、三种物理格式、四种容量设计和四种历史使用情况,该数据集为生成式机器学习模型提供了丰富的训练数据。这些模型能够生成在未见过的退役条件下电池的脉冲电压响应数据,从而实现对电池SOH的快速且准确估计。
解决学术问题
PulseBat数据集解决了电池回收领域中一个关键的学术问题,即在退役电池的随机条件下,如何快速且准确地估计电池的健康状态(SOH)。传统的数据驱动方法需要大量数据且对退役条件敏感,而PulseBat通过生成式机器学习策略,显著提高了SOH估计的精度和鲁棒性,为可持续电池回收提供了技术支持。
衍生相关工作
PulseBat数据集的发布催生了一系列相关研究工作,特别是在电池健康状态估计和生成式机器学习领域。研究者们基于该数据集开发了多种改进的生成模型和回归算法,进一步提升了电池SOH估计的准确性和适用性。此外,该数据集还激发了对电池回收过程中数据生成和处理方法的深入探讨,推动了相关技术的创新和发展。
以上内容由遇见数据集搜集并总结生成



